Abstract:
Capitolul 1 prezintă definiţii şi terminologie, etapele procesului de data
mining, domeniile de aplicare, instrumente utilizate, noţiunea de clasificare a
datelor, algoritmi de clasificare, seturi de date utilizate la analiza algoritmilor,
etc. Capitolul 2 trateaza preporcesarea datelor şi prezintă o sinteză a
tehnicilor de preprocesare, aspecte legate de instrumentul conceput şi
implmentat Arff Convertor şi realizează o analiză statistică a datelor unor
studenţi. Capitolul 3 prezintă algoritmul ACO, se analizează comportametul
lui rulând foarte multe configuraţii de parametrii, iar in urma analizei se emit
recomandări privind alegerea parametrilor. Se prezintă diverse variante ale
lui ACO şi se propun 4 imbunătăţiri care se implmentează în Ant-r-Miner. În
capitolul 4 se prezintă aspecte legate de algorimii genetici utilizati la
clasificarea datelor şi se propune un nou algoritm genetic care se
implementaeza in Weka. Se analizează comportamentul său la diferite valori
ale parametrilor de intrare şi se emite o listă de recomnadări privind alegerea
acestora. În capitolul 5 este concepută o nouă metodă de a realiza predicţii
în Weka, cu ajutorul unei interfete dinamice, funcţie de setul de date
analizat. În capitolul 6 sunt analizate date legate de nasterile care au avut loc
la Clinica de Obstretica si Ginecologie Bega, Timisoara în anul 2010. Se
construiesc cu algoritmii propusi clasificatori în funcţie de indicele apgar.