Uvod: uvod v analizo podatkov z metodami umetne inteligence, osnovne in napredne naloge strojnega učenja, analiza podatkov po CRISP-DM metodologiji.
Predstavitev in priprava podatkov: predstavitev standardnih oblik zapisa različnih vrst podatkov, pretvorba podatkovnih baz in skladišč v tabelarično obliko, priprava podatkov za linearno regresijo, učenje nevronskih mrež in preprostih jezikovnih modelov.
Tehnike analize tabelaričnih podatkov: predstavitev posameznih tehnik analize podatkov vključno s predstavitvijo preiskovalnih hevristik in metod za učenje odločitvenih dreves, učenje klasifikacijskih in povezovalnih pravil, razvrščanje v skupine, odkrivanje podskupin, učenje regresijskih dreves in relacijsko podatkovno rudarjenje, ansambli drevesnih modelov. Metode za ocenjevanje kvalitete naučenih vzorcev in modelov ter metodologija evalvacije rezultatov.
Uvod v analizo tekstovnih podatkov: posebnosti analize tekstovnih, spletnih in večpredstavnih podatkov z metodami umetne inteligence. Osnovne dimenzije analize tekstovnih podatkov.
Predstavitev tekstovnih podatkov: metode za predstavitev tekstovnih podatkov in njihova primernost za reševanje različnih nalog.
Tehnike analize tekstovnih, spletnih in večpredstavnih podatkov: predstavitev posameznih tehnik za analizo tekstovnih, spletnih in večpredstavnih podatkov ter metod vizualizacije tekstovnih podatkov. Primeri reševanja različnih nalog s pristopi analize tekstovnih podatkov, vključno z večjezičnimi in prekojezičnimi pristopi. Predstavitev motivacije za razvoj jezikovnih modelov in metod procesiranja naravnega jezika na osnovi jezikovnih modelov. Ocenjevanje uspešnosti modelov za analizo tekstovnih podatkov.
Etični vidiki in regulacija sistemov za analizo podatkov z metodami umetne inteligence.
Praktično usposabljanje: praktična uporaba izbranih orodij za manipulacijo in analizo podatkov, in razvoj metod procesiranja naravnega jezika in jezikovnih modelov.
Introduction: introduction to data analysis with artificial intelligence methods, elementary and advanced machine learning methods, data analysis with CRISP-DM methodology.
Data representation and data preprocessing: presentation of standard data formats, transformation of databases and data warehouses into tabular data representation format, preparation of data for linear regression, learning of neural networks and simple language models.
Techniques for analysis of tabular data: presentation of specific data analysis techniques including presentation of search heuristics, decision tree learning, learning classification and association rules, clustering, subgroup discovery, regression tree learning, and relational data mining, ensembles of tree models. Methods for assessing the quality of learned patterns and models, and methodology for evaluating results.
Introduction to text data analysis: specifics of text, web and multimedia data analysis using artificial intelligence methods. Basic dimensions of text data analysis.
Text data representation: methods for representing text data and their suitability for solving various tasks.
Techniques for analyzing text, web and multimedia data: presentation of individual techniques for analyzing text, web and multimedia data, and methods for visualizing text data. Examples of solving various tasks with text data analysis approaches, including multilingual and cross-lingual approaches.
Evaluation of the effectiveness of models for analyzing text data.
Techniques and methods for analyzing and processing text data: presentation of the motivation for developing language models with the Transformer architecture, and presentation of natural language processing methods based on language models.
Ethical aspects and regulation of AI systems using data analysis.
Practical training: practical use of selected tools for manipulating and analyzing data, and developing methods for processing natural language and language models.
Evaluation: presentation of methods for estimating the quality of induced patterns and models, and methodology for result evaluation.
Practical training: practical use of selected data manipulation and data analysis tools.