Triedenie poľa štruktúr (riešené príklady)

Z Kiwiki
Skočit na navigaci Skočit na vyhledávání

Algoritmy a programovanie - zbierka úloh


Štruktúry

Rekurzia

Dynamická alokácia pamäti

Vyhľadávanie

Triedenie

>Triedenie poľa komplexných čísel
>Triedenie poľa smerníkov na CPLX
>Triedenie poľa štruktúr
>Triedenie poľa smerníkov

Lineárny zoznam

Binárny strom

Numerické algoritmy

Triedenie poľa štruktúr

Zadanie

Zostavte program, ktorý bude triediť dáta uložené v súbore na základe užívateľom zadaného kritéria. Program po spustení načíta dáta zo súboru a uloží ich do poľa štruktúr. Následne na monitor zobrazí výzvu, v ktorej bude mať užívateľ možnosť vybrať kritérium triedenia. Pre jednoduchosť uvažujme príklad, v ktorom budeme triediť zamestnancov nejakej fiktívnej firmy podľa mena, priezviska alebo podľa roku jeho narodenia. Dáta v súbore nech sú uložené vo formáte kde jednotlivé položky sú oddelené medzerami čiarkami v tvare:

Meno Priezvisko , Rok_narodenia 

Metodický komentár

Cieľom tejto úlohy je precvičiť prácu so štruktúrami v jazyku C, použitie funkcie rýchleho triedenia (quick sort) z knižnice stdlib.h, načítavanie dát zo súboru, a pomôcť osvojiť si základné znalosti pri práci s ukazovateľmi (predávanie ako parameter do funkcie, pretypovávanie).

Vzorové dáta

Janko Maly , 1978
Martin Starsi , 1939
Andrea Mlada , 1990
Jozko Cierny , 1985
Alenka Biela , 1985
Janko Maly , 1983
Alzbetka Mudra , 1978

Zjednodušujúce predpoklady

Dĺžka mena ani priezviska neprekračuje rozsah 20 znakov. V zdrojovom súbore sa nebude nachádzať viac ako 100 záznamov. Zdrojový súbor sa nachádza v tom istom adresáry ako samotný program (*.exe súbor) a jeho názov je: data.txt.

Vzorová výzva programu

Vyber kriterium triedenia.
  Meno                     1
  Priezvisko               2
  Rok narodenia            3
  Pre ukoncenie programu   0
Volba: _

Vzorový vstup

1	

Vzorový výstup

--------------------------------------------------------
 ZAMESTNANEC                               ROK NARODENIA
--------------------------------------------------------
 Alenka               Biela                    1985
 Alzbetka             Mudra                    1978
 Andrea               Mlada                    1990
 Janko                Maly                     1983
 Janko                Maly                     1978
 Jozko                Cierny                   1985
 Martin               Starsi                   1939
--------------------------------------------------------

Návod ako začať

Zo zadania vyplýva, že hlavným účelom programu je triediť (vzostupne príp. zostupne zoradzovať) zamestnancov podľa triediaceho kritéria (meno, priezvisko, rok). Aby sme pri manipulácii (triedení) s jednotlivými zamestnancami pracovali ucelene so všetkými dátami vzťahujúcimi sa ku konkrétnemu zamestnancovi naraz, bude výhodné použiť štruktúru, ktorá nám tieto dáta takpovediac "zabalí". Takto budeme mať údaje o jednom zamestnancovi pohromade a budeme môcť s nimi pohodlne manipulovať. Týmto sme vyriešili problém ako reprezentovať jedného zamestnanca. Teraz sa vynára otázka ako efektívne pracovať s celým súborom zamestnancov. Pretože vieme, že v zdrojovom súbore sa nebude nachádzať viac ako 100 zamestnancov, bude vcelku výhodné použiť statické pole štruktúr na pamätanie všetkých zamestnancov. Dĺžka tohto poľa bude 100 položiek. Jedna položka poľa potom bude predstavovať jedného konkrétneho zamestnanca. Utriedenie zamestnancov potom budeme realizovať utriedením tohto poľa. Pre triedenie poľa ponúka knižnica stdlib.h funkciu rýchleho triedenia qsort. Parametre a použitie funkcie qsort z knižnice stdlib.h sú na stránke qsort.

Možné riešenie v jazyku C

  1 #include<stdio.h>
  2 #include<stdlib.h>
  3 #include<conio.h>
  4 #include<string.h>
  5 
  6 #define NAZOV_SUBORU "data.txt"
  7 
  8 // Vytvorenie pomenovanej struktury s nazvom "ZAMESTNANEC"
  9 struct ZAMESTNANEC {
 10    char meno[21];
 11    char priezvisko[21];
 12    int rok_narodenia;
 13    };
 14 
 15 // Uplne funkcne prototypy pouzivanych funkcii:
 16 
 17 // Nacitanie jedineho zamestnanca zo suboru
 18 int nacitajZAMESTNANEC(FILE *fr, ZAMESTNANEC *V);	 
 19 
 20 // Vypisanie jedineho zamestnanca na monitor
 21 void vypisZAMESTNANEC(ZAMESTNANEC V);			 
 22 
 23 // Porovnanie dvoch zamestnancov podla roku narodenia
 24 int porovnajROK(const void *V1, const void *V2);	 
 25 
 26 // Porovnanie dvoch zamestnancov podla mena
 27 int porovnajMENO(const void *V1, const void *V2); 	 
 28 
 29 // Porovnanie dvoch zamestnancov podla priezviska
 30 int porovnajPRIEZV(const void *V1, const void *V2);      
 31 
 32 // Hlavna funkcia programu:
 33 int main(int argc, char* argv[])
 34 {
 35    ZAMESTNANEC pole[100];         // pole struktur pre uchovavanie jednotlivych zamestnancov
 36    int Pocet_zamestnancov = 0;    // pocet nacitanych zamestnancov
 37    int volba;                     // kriterium triedenia / ukoncenia programu
 38    FILE *fr;                      // pointer na subor
 39    int i;                         // pomocna premenna
 40    
 41    // Otvorenie zdrojoveho suboru v rezime "read"
 42    if((fr=fopen(NAZOV_SUBORU,"r"))==NULL)
 43    {
 44       printf("\n Pozadovany subor sa nepodarilo otvorit!\n");
 45       system("pause");
 46       exit(1);
 47    }
 48 
 49    // Nacitanie vsetkych zamestnancov zo suboru
 50    for(i=0; nacitajZAMESTNANEC(fr,&pole[i]); i++)
 51    {
 52       ;
 53    }
 54    Pocet_zamestnancov = i;
 55    fclose(fr); // zatvorenie suboru, data uz su nacitane..
 56    fr = NULL;  // zaroven nastavime na NULL pre pripad aby sme 
 57                // v pripade chybneho pouzitia tohto poitera boli vcas varovani
 58    
 59    // Hlavny cyklus programu 
 60    do{
 61       printf("\n Vyber kriterium triedenia. \n"
 62                "   Meno                     1\n"
 63 	       "   Priezvisko               2\n"
 64 	       "   Rok narodenia            3\n\n"
 65 	       "   Pre ukoncenie programu   0\n\n"
 66                " Volba: ");
 67       scanf("%d",&volba);
 68       
 69       switch(volba)
 70       {
 71          case 0: break;
 72          case 1: qsort((void*)pole,Pocet_zamestnancov,sizeof(ZAMESTNANEC),porovnajMENO);   break; 
 73                                     // namiesto sizeof(ZAMESTNANEC) mozeme pouzit sizeof(pole[0])
 74          case 2: qsort((void*)pole,Pocet_zamestnancov,sizeof(ZAMESTNANEC),porovnajPRIEZV); break;
 75          case 3: qsort((void*)pole,Pocet_zamestnancov,sizeof(ZAMESTNANEC),porovnajROK);    break;
 76          default:
 77             printf("\n Neocakavany vstup. Program bude ukonceny.\n");
 78             volba=0;
 79       }
 80       if(volba) // Vypisanie utriedeneho pola na monitor
 81       {
 82          clrscr(); //vycistime si obrazovku
 83          printf("--------------------------------------------------------\n");
 84          printf(" ZAMESTNANEC                               ROK NARODENIA\n");
 85          printf("--------------------------------------------------------\n");
 86          for(i=0; i<Pocet_zamestnancov; i++)
 87             vypisZAMESTNANEC(pole[i]);
 88          printf("--------------------------------------------------------\n");
 89       }
 90    }while(volba);
 91 
 92    system("pause");
 93    return 0;
 94 }
 95 
 96 // Definicie pouzivanych funkcii:
 97 //---------------------------------------------------------------------------
 98 int nacitajZAMESTNANEC(FILE *fr, ZAMESTNANEC *V)
 99 {
100    int a;
101    a = fscanf(fr,"%s %s , %d", V->meno, V->priezvisko, &V->rok_narodenia);
102    if(a == EOF) a = 0;
103    return a;
104 }
105 //---------------------------------------------------------------------------
106 void vypisZAMESTNANEC(ZAMESTNANEC V)
107 {
108    printf(" %-20s %-20s     %d\n", V.meno, V.priezvisko, V.rok_narodenia);
109 }
110 //---------------------------------------------------------------------------
111 int porovnajROK(const void *V1, const void *V2)
112 {
113    return ((ZAMESTNANEC*)V1)->rok_narodenia - ((ZAMESTNANEC*)V2)->rok_narodenia;
114 }
115 //---------------------------------------------------------------------------
116 int porovnajMENO(const void *V1, const void *V2)
117 {
118    return strcmp(((ZAMESTNANEC*)V1)->meno, ((ZAMESTNANEC*)V2)->meno);
119 }
120 //---------------------------------------------------------------------------
121 int porovnajPRIEZV(const void *V1, const void *V2)
122 {
123    return strcmp(((ZAMESTNANEC*)V1)->priezvisko, ((ZAMESTNANEC*)V2)->priezvisko);
124 }

Komentár k uvedenému riešeniu

V programe sa na prvý pohľad nachádza zopár zvláštností. Prvou je prázdne telo cyklu for pri načítavaní zamestnancov zo súboru - pozri riadok xx programu (nachádza sa tam len bodkočiarka za účelom zdôraznenia vedomého vypustenia tela funkcie). Dôvodom je, že samotné načítanie zamestnancov sa nachádza v porovnávacej (testovacej) časti cyklu for. Ak sa úspešne načíta nejaký zamestnanec zo súboru potom funkcia nacitajZAMESTNANEC vracia nenulové kladné číslo, v opačnom prípade nulu a cyklus for sa skončí. Druhou zvláštnosťou je spôsob načítavania položiek "meno", "priezvisko" a "rok_narodenia" v tele definicie funkcie nacitajZAMESTNANEC - pozri riadok xx. V tomto prípade s výhodou využívame možností funkcie fscanf, pričom využívame skutočnosť, že jednotlivé položky sú oddelené medzerou a čiarkou. Treťou zvláštnosťou je použitie typu const void * v parametroch a následné pretypovávanie v tele na pointer na pomenovanú štruktúru ZAMESTNANEC vo všetkých troch porovnávacích funkciách - porovnajMENO, porovnajPRIEZV a porovnajROK. Toto priamo súvisí s požiadavkou na parametre porovnávacej funkcie, ktorá musí vyhovovať funkčnému prototypu funkcie triedenia - qsort.

Nedostatky uvedeného riešenia a námety na zlepšenie

Program nie je vhodný na triedenie väčšieho množstva dát. Pri triedení sa manipuluje s celými položkami (štruktúra ZAMESTNANEC), ktoré majú v tomto prípade veľkosť sizeof(ZAMESTNANEC) == 48 Bajtov. Funkcia qsort tak musí pri triedení kopírovať celý obsah, čo môže byť časovo náročné. Ak by navyše jednotlivé položky uchovávali ešte väčie množstvo dát (ďalšie údaje o zamestnancovi, ako napríklad pracovné zaradenie, osobné hodnotenie zamestnanca, kontaktné informácie a pod.) bola by situácia ešte horšia. Podobný nedostatok má aj funkcia vypisZAMESTNANEC. V tomto prípade však tento problém nie je kritický. Prvou možnosťou ako zefektívniť triedenie je redukovanie veľkosti štruktúry ZAMESTNANEC. To sa dá docieliť použitím dynamicky alokovanej pamäte pre uchovávanie mena a priezviska zamestnanca. V tomto prípade by mohla štruktúra ZAMESTNANEC vyzerať nasledovne:

struct ZAMESTNANEC {
   char *meno;
   char *priezvisko;
   int rok_narodenia;
   };

Potom by sa pamäťové nároky na uchovávanie redukovali na 12 Bajtov. Je však nevyhnutné pamätať na to, že adresy uchovávané v položkách "meno" a "priezvisko" môžu byť ľubovolné (sú neinicializované) a preto môžu ukazovať na ľubovolné miesto v pamäti. Preto treba použiť dynamickú alokáciu pamäte (funkcia malloc, resp. operátor new) a ukazovatele "meno" a "priezvisko" správne nastaviť (využitím návratovej hodnoty funkcie malloc, resp. operátora new).

Ďalšou možnosťou ako zefektívniť triedenie je použitie poľa ukazovateľov na prvky typu ZAMESTNANEC. Ukazovateľ na typ ZAMESTNANEC (či už pôvodný alebo tu uvedený) má veľkosť 4 Bajty. Z pohľadu triedenia funkciou qsort je preto tento spôsob ešte výhodnejší.

Použitím kombinácie oboch možností (dynamicky alokovaný priestor pre uchovávenie jednotlivých záznamov typu ZAMESTNANEC a použitie poľa ukazovateľov na prvky typu ZAMESTNANEC pre účely triedenia) je možné dosiahuť hospodárne využitie pamäte a zároveň efektívne triedenie rozsiahlejšieho súboru dát.

Druhou možnosťou sa zaoberá nasledujúca časť - Triedenie poľa ukazovateľov.