Obsah práce
1.	WDM optické siete
2.	Sieť OBS
3.	Simulačné prostredie NCTUns
4.	Simulácia v NCTUns
5.	Vyhodnotenie simulácie vlastností generátorov prevádzkových tokov

Vyhodnotenie simulácií spracujem pomocou metódy Chi Square Test - Test Dobrej zhody. Spracovanie dát bude prebiehať v programoch MS Excel 2007 a Statistica 7.

V programe MS Excel 2007 vytvorím akúsi predprípravu dát na finálne spracovanie. Dáta vygenerované do výstupného logu sú totiž veľmi rozsiahle (rádovo desať tisíce záznamov ) a príliš „surové“. Z pohľadu spracovania sú dôležité uzly 10 a 6 (viď Obrázok 17: Topologia pre simuláciu), nakoľko práve medzi týmito dvoma uzlami je zaujímavý charakter sieťovej prevádzky. V programe MS Excel 2007 pospájam polia podľa packet trace format, pomocou jednoduchých vzorcov. Následne vyfiltrujem dáta len pre sieťovú prevádzku z uzla 10 do uzla 6.

Vyfiltrované dáta spracujem v prostredí Statictica 7. Zostrojím histogramy pre všetky simulácie, až následne dáta z histogramov budem môcť použiť do Testu Dobrej zhody.

Chi Square Test – Test Dobrej Zhody

Chi-kvadrát test dobrej zhody testuje nulovú štatistickú hypotézu, ktorá tvrdí, že početnosti v jednotlivých kategóriách sa rovnajú očakávaným (teoretickým) početnostiam.

Ak P - hodnota je nižšia ako zvolená hladina významnosti (tradične 5 % = 0,05, prípadne 1 % alebo 0,1 %), nulová hypotéza sa zamietne. Znamená to, že rozdiel medzi početnosťami zistenými vo vzorke a očakávanými početnosťami je príliš veľký na to, aby bol iba dôsledkom náhodného výberu, teda je štatisticky významný.

Ak je P - hodnota rovná alebo vyššia ako zvolená hladina významnosti, nulovú hypotézu nemožno zamietnuť. Znamená to, že rozdiel medzi početnosťami zistenými vo vzorke a očakávanými početnosťami môže byť dôsledkom náhodného výberu, teda nie je štatisticky významný.

Pre použitie testu sa vyžaduje splnenie nasledujúcich podmienok:

Celkový počet pozorovaných početností n ≥ 10
Počet kategórií c ≥ 3
Všetky očakávané hodnoty eij ≥ 0,25 [7]

Často používame tento test pre overenie predpokladu, že rozdelenie pravdepodobnosti veličiny P je určitého typu, napríklad normálne rozdelenie, Poissonové rozdelenie, Exponenciálne apod. V prípade, že nulová hypotéza špecifikuje iba typ pravdepodobnostného rozdelenia, ale nie hodnoty parametrov rozdelenia, musia byť parametre dopredu z výberu odhadnuté. Na každý takýto odhad sa počet stupňov voľnosti testovanej štatistiky znižuje o jedna. [8]

Vzťahy pre výpočet nulovej hypotézy

Testovanú štatistiku X2 je možné vyjadriť nasledovne:

[math]{{X}^{2}}=\underset{i=1}{\overset{k}{\mathop \sum }}\,\frac{{{\left( {{n}_{i}}-n{{\pi }_{i}} \right)}^{2}}}{n\pi i}[/math]

(1)

Kde premenné funkcie sú:

[math]n_i[/math] – pozorovaná početnosť
[math]n{\pi }_{i}[/math] – očakávaná početnosť
k – počet triednych intervalov.

Pomer [math]n_i[/math] voči n je možné vyjadriť:

[math]\frac{n_i}{n}[/math] - pomer relatívnej početnosti

a

[math]{\pi }_{i}[/math] – hypotetická pravdepodobnosť

Vyjadrenú testovanú štatistiku je následne nutné porovnať s kritickou hodnotou, ktorá je rovná kvantilu:

[math]X_{1-\alpha ~}^{2}(df)[/math]

(2)

Rozdelenie [math]X^2[/math]:

[math]df=k-m-1 [/math]

(3)

Kde premenné sú:

df – počet stupňov voľnosti
m – počet parametrov

Vzťah 3 platí len pre situáciu, kde nulovú hypotézu uplatňujeme na overenie pravdepodobnosti, že určité rozdelenie je daného typu, inak platí nasledovné:

[math]df=k-1[/math]

(4)

Pre určenie kritickej hodnoty použijem tabuľku v Príloha B. V tabuľke je spracovaný výpočet kritickej chyby. Stĺpce tabuľky tvoria hladiny významnosti a riadky stupne voľnosti štatistického súboru. [8]

Vzťažné - očakávané dáta sú v mojom prípade dáta vygenerované programom MS Excel 2007 podľa daného rozdelenia. Pozorované dáta sú vygenerované simulačným prostredím NCTUns. Pozorované dáta boli generované na základe mnou vytvorených skriptov. Nasleduje 6 vybratých simulácií rozdelených do 3 scenárov.

Scenár 1: Exponenciálne rozdelenie

Simulácia 1.1

Vstupný skript:

type: udp
start_time: 1
on-off: 200
on: time: 600 const 0.01 length: exponential 800 50 1000

Histogram:

Graf 1

Popis legendy:

Obseved – ni
Expected - [math]n{\pi}i[/math]

Poznámka: Platí pre všetky simulácie.

Tabuľka spracovania:

Tabuľka 1
i	n_i	nπ_i	x²_i
1	8	6	0,667
2	26	26	0,000
3	23	24	0,042
4	15	15	0,000
5	18	17	0,059
6	10	12	0,333
7	10	8	0,500
8	9	11	0,364
9	5	4	0,250
10	0	1	1,000

df=k-m-1=8
x2=3,214
α=15,510
x2 < α

Simulácia 1.2

Vstupný skript:

type: udp
start_time: 1
on-off: 200
on: time: 600 const 0.01 length: exponential 100 10 800

Histogram:

Graf 2

Tabuľka spracovania:

Tabuľka 2
i	n_i	nπ_i	x²_i
1	31	31	0,000
2	24	24	0,000
3	18	17	0,059
4	14	15	0,067
5	13	13	0,000
6	9	9	0,000
7	8	8	0,000
8	7	7	0,000
9	3	3	0,000

df=k-m-1=7
x2=0,125
α=14,07
x2 < α

Simulácia 1.3

Vstupný skript:

type: udp
start_time: 1
on-off: 200
on: time: 600 const 0.01 length: exponential 100 10 250

Histogram:

Graf 3

Tabuľka spracovania:

Tabuľka 3
i	n_i	nπ_i	x²_i
1	21	13	4,923
2	27	34	1,441
3	17	18	0,056
4	14	13	0,077
5	13	13	0,000
6	10	10	0,000
7	6	7	0,143
8	8	9	0,111
9	5	5	0,000
10	2	2	0,000
11	1	1	0,000

df=k-m-1=9
x2=6,751
α=16,920
x2 < α

Scenár 2: Konštantné rozdelenie

Simulácia 2.1

Vstupný skript:

type: udp
start_time: 1
on-off: 200
on: time: 600 const 0.01 length:const 1000

Histogram:

Graf 4

Tabuľka spracovania:

Tabuľka 4
i	n_i	nπ_i	x²_i
1	5	4	0,250
2	15	12	0,750
3	20	17	0,529
4	24	30	1,200
5	14	15	0,067
6	14	13	0,077
7	10	10	0,000
8	9	9	0,000
9	12	11	0,091
10	1	3	1,333

df=k-m-1=8
x2=4,279
α=15,510
x2 < α

Simulácia 2.2

Vstupný skript:

type: udp
start_time: 1
on-off: 200
on: time: 600 const 0.01 length: const 100

Histogram:

Graf 5

Tabuľka spracovania:

Tabuľka 5
i	n_i	nπ_i	x²_i
1	14	0	-
2	23	9	21,778
3	21	19	0,211
4	19	26	1,885
5	16	20	0,800
6	29	14	16,071
7	2	26	22,154
8	0	9	9,000
9	0	1	1,000

df=k-m-1=7
x2=72,898
α=14,07
x2 > α

Simulácia 2.3

Vstupný skript:

type: udp
start_time: 1
on-off: 200
on: time: 600 const 0.01 length: const 10

Histogram:

Graf 6

Tabuľka spracovania:

Tabuľka 6
i	n_i	nπ_i	x²_i
1	13	0	-
2	13	2	60,500
3	8	14	2,571
4	12	9	1,000
5	12	9	1,000
6	10	9	0,111
7	14	16	0,250
8	10	10	0,000
9	14	14	0,000
10	15	8	6,125
11	7	15	4,267
12	0	16	16,000
13	0	2	2,000

df=k-m-1=11
x2=93,824
α=19,68
x2 > α

Scenár 3: Rovnomerné rozdelenie

Simulácia 3.1

Vstupný skript:

type: udp
start_time: 1
on-off: 200
on: time: 600 const 0.01 length: uniform 10 100

Histogram:

Graf 7

Tabuľka spracovania:

Tabuľka 7
i	n_i	nπ_i	x²_i
1	20	16	1,000
2	17	22	1,136
3	14	23	3,522
4	16	14	0,286
5	14	11	0,818
6	21	14	3,500
7	20	18	0,222
8	2	6	2,667

df=k-m-1=6
x2=13,151
α=12,59
x2 > α

Simulácia 3.2

Vstupný skript:

type: udp
start_time: 1
on-off: 200
on: time: 600 const 0.01 length: uniform 100 1000

Histogram:

Graf 8

Tabuľka spracovania:

Tabuľka 8
i	n_i	nπ_i	x²_i
1	11	11	0,000
2	14	12	0,333
3	17	21	0,762
4	13	13	0,000
5	22	15	3,267
6	15	21	1,714
7	15	16	0,063
8	15	15	0,000

df=k-m-1=6
x2=6,139
α=12,590
x2 < α

Simulácia 3.3

Vstupný skript:

type: udp
start_time: 1
on-off: 200
on: time: 600 const 0.01 length: uniform 50 300

Histogram:

Graf 9

Tabuľka spracovania:

Tabuľka 9
i	n_i	nπ_i	x²_i
1	3	0	-
2	7	9	0,444
3	19	10	8,100
4	16	10	3,600
5	10	13	0,692
6	13	10	0,900
7	12	14	0,286
8	14	10	1,600
9	16	12	1,333
10	2	19	15,211
11	11	10	0,100
12	3	7	2,286

df=k-m-1=10
x2=34,552
α=18,31
x2 > α

Zhrnutie

Počet simulácií, kde testovaný štatistický súbor vyšiel menší ako kritická hodnota je 5 a naopak počet simulácií kde testovaný štatistický súbor vyšiel väčší ako kritická hodnota je 4. Zaujímavé je aj členenie správnych výsledkov, pri exponenciálnom rozdelení vyšli všetky výsledky menšie ako kritická hodnota a naopak pri rovnomernom rozdelení vyšla nižšia iba jedna hodnota. Pri zvažovaní a tvorbe záveru je nutné brať na zreteľ i rušivé vplyvy na vyhodnotenie. Za rušivý vplyv je možné brať správnosť vzťažných údajov generovaných programom MS Excel 2007, ďalej voľba štatistického súboru na spracovania. Ako som už spomínal výstupný log zo simulácie bol veľmi rozsiahly a pre spravovanie som vybral len časť dát (technická manipulácia s viac ako štvrť miliónom údajov v programe MS Excel 2007 nie je možná). Je teda viac ako pravdepodobné, že so sofistikovanejšími CAE programami by mohli byť výsledky presnejšie. Netransparentnosť výsledkov mohla rovnako vzniknúť už pri tvorbe vstupných skriptov, nakoľko práve tu sa charakterizuje tvorba zhlukov

Záver

Ako som už spomínal v úvode tejto práce, mojim cieľom je overiť korektnosť generátorov prevádzkových tokov. To sa mi aj podarilo vďaka experimentom pri tvorbe simulácií. Z výsledkov simulácií som získal potrebné dáta do následného spracovania. Zo štatistického spracovania som zistil, že pri 5% hladine významnosti môžem zamietnuť nulovú hypotézu pri 5 simuláciách z 9. Pri zvyšných štyroch nie je možné nulovú hypotézu zamietnuť t.j. je štatisticky nevýznamná. Za 100% korektné možno považovať pracovanie generátora pri tvorbe zhlukov s exponenciálnym rozdelením. Naopak za najmenej korektné je možné považovať správanie sa generátora s rovnomerným tvorením zhlukov. Všeobecne je však možné simulácie a experimenty považovať za úspešné. Implementovanie získaných výsledkov do praxe je možné realizovať pomocou internetového fóra na stránkach National Chiao Tung University v Taiwane, kde profesor S. Wang zbiera informácie od študentov z celého sveta. Implementovaním výsledkov je možné vylepšiť vlastnosti simulačného prostredia NCTUns a pomôcť tak sieťovým inžinierom získavať korektnejšie informácie pri simuláciách OBS sietí, nakoľko možná budúcnosť, kadiaľ smerovať WDM optické siete, je práve OBS technológia.

Použitá literatúra

BATTESTILLI, Tzevetelina, PERROS, Harry. An Introduction to Optical Burst Switching. IEEE Optical Communications. August 2003, no. ?, s. 10-15.
CISCO Networking Academy : CCNA [online]. c1992 , 26.11.2009 [cit. 2009-12-03]. Dostupný z WWW: <http://www.cisco.com/web/learning/netacad/index.html>.
NCTUns 6.0 Network Simulator and Emulator [online]. c1999 , 11.11.2009 [cit. 2009-12-03]. Dostupný z WWW: <http://nsl.csie.nctu.edu.tw/nctuns.html>.
SHIE - YUAN, Wang; CHIN - LIANG, Chou; CHIN - CHE, Lin. The GUI User Manual for the NCTUnc 6.0 Netowork Simulator and Emulator. In [online]. [s.l.] : Network and System Laboratory, Department of Computer Science, September 2009 [cit. 2010-06-07].
BAHLEDA, Miroslav. Just-in-time Optical Burst Switching. Science, Education and Society : 11th International Scientific Conference. 2003, roč. 11, s. 1-19. Dostupný z WWW: <http://www.bahleda.sk/dokumenty/pub/jit-obs.ppt>.
HRUBÝ, Martin, et al. Simulátor komunikácie v počítačovej sieti. [s.l.], 2009. 59 s. Slovenská technická univerzita, Fakulta informatiky a informačných technológií. Vedúci tímovej práce Ing. I. Grellneth, PhD.
RIMARČÍK, Marián. Http://rimarcik.com/ [online]. 2000 [cit. 2010-07-06]. Štatistická analýza. Dostupné z WWW: http://rimarcik.com/navigator/chi.html
Http://new.euromise.org/ [online]. 5.1.1999 [cit. 2010-07-06]. Analýza kategoriálních dat. Dostupné z WWW: <http://new.euromise.org/czech/tajne/ucebnice/html/html/node12.html>.
ARACIL, Javier, Prof. et al. The e-Photon/ONe research agenda in Optical Burst Switching : Bustification algorithms. Dostupný z WWW: < http://eurongi.enst.fr/archive/168/aracil.ppt>.

Slovník

Anycast: Adresovanie vybratým zariadeniam v sieti
Broadcast: Adresovanie všetkým zariadeniam v sieti
Burst: Zhluk prenášaných dát s variabilnou veľkosťou
Fairness: Pravidlá zdieľania prenosových kapacít
Next hop: Proces preposielania paketov pri smerovaní
OBS: Optická sieť s prepojovaním zhlukov
Offset Time: Oneskorenie
OS: Operačný systém
Paket: Balíček prenášaných dát
Poissonov model: Forma regresnej analýzy využívanej v štatistike
QoS: Kvalita služieb
Router: Smerovač, zariadenie zabezpečujúce komunikáciu medzi sieťami
Self-similarity: Seba podobnosť
Throughput: Hranica priepustnosti siete
Token: Príznak charakterizujúci spôsob spracovania dát
Topológia: Fyzická a logická architektúra počítačovej siete
Vlnová dĺžka: Vzdialenosť medzi opakujúcimi sa periódami vlnenia

Skratky a akronymy

AON: All Optical Network
BER: Bit Error Rate
CAE: Computer Aided Engineering
CoS: Class of Service
GMPLS: Generalized Multiprotocol Label Switching
GUI: Graphic User Interface
JET: Just Enough Time
MPLS: Multiprotocol Label Switching
OBS: Optical Burst Switching
OBSN: Optical Burst Switched Network
OEO: Optical-Electrical-Optical
OPSN: Optical Packet Switched Network
QoS: Quality of Service
RWA: Routin and Wavelenght Allocations
SOA: Service-oriented architecture
WDM: Wavelenght Division Multiplexing
WR: Wavelenght Routing
WRN: Wavelenght Routed Network

Vyhodnotenie simulácie vlastností generátorov prevádzkových tokov

Obsah

Chi Square Test – Test Dobrej Zhody

Vzťahy pre výpočet nulovej hypotézy

Scenár 1: Exponenciálne rozdelenie

Simulácia 1.1

Simulácia 1.2

Simulácia 1.3

Scenár 2: Konštantné rozdelenie

Simulácia 2.1

Simulácia 2.2

Simulácia 2.3

Scenár 3: Rovnomerné rozdelenie

Simulácia 3.1

Simulácia 3.2

Simulácia 3.3

Zhrnutie

Záver

Použitá literatúra

Slovník

Skratky a akronymy

Navigačné menu

Osobné nástroje

Menné priestory

Varianty

Zobrazenia

Viac

Hľadať

Navigácia

Rýchle linky

Nástroje