У Београду је од 22. до 24. марта одржана радионица посвећена обуци за истраживање ELTeC-a.
ELTeC је скраћеница за European Literary Text Collection, а назив радионице био је: Exploring ELTeC: Use-cases for Information Extraction and Analysis. Ово је била завршна обука у оквиру COST акције (16204) Distant Reading for European Literary History.
Домаћин је био Рударско-геолошки факултет Универзитета у Београду, а организатори проф. др Ранка Станковић и проф. др Цветана Крстев, као и Јоана Бишук (Joanna Byszuk) са Института за пољски језик Пољске академије наука. Радионица је одржана у хибридном облику. Неки учесници (као и предавачи) били су на Рударско-геолошком факултету, док су неки учествовали онлајн. На радионици је учествовала др Александра Марковић, сарадница Института за српски језик САНУ.
На радионици су представљени приступи екстраховању информација и анализи текстуалних података, посебно из корпуса ELTeC, који је развијен у оквиру COST акције. Међу обрађеним темама су били различити аспекти рада са именованим и географским ентитетима, у вези с њиховим препознавањем (NER, named entities recognition) и екстраховањем, радом са Вики подацима (Wiki-ELTeC data), повезивањем историјских података у Nodegoat-у (апликацији посебно израђеној за истраживања у хуманистици), семантичком анализом с угнежђеним репрезентацијама речи (енгл. word embeddings) и језичким моделима, као и са поређењем корпуса помоћу стилометрије. За учешће у радионици нису били постављени формални захтеви у смислу образовања, али је, с обзиром на интензитет и обим програма, било препоручено да учесници поседују основне информатичке вештине. Радионица је била намењена истраживачима из земаља укључених у пројекат Distant Reading, заинтересованим за дигитално истраживање књижевности, корпусну и рачунарску лингвистику, теорију књижевности, као и њихову методолошку примену ван граница националних традиција.
Међу предавачима је било много познатих имена: Christof Schöch (са Универзитета у Триру), Маciej Eder, Joanna Byszuk, Artjoms Šeļa (са Института за пољски језик Пољске академије наука), Diana Santos (Универзитет у Ослу), Бенедикт Перак (Универзитет у Ријеци), Fotis Yannidis (Универзитет у Вирцбургу), Цветана Крстев, Ранка Станковић, Милица Иконић Нешић (Универзитет у Београду) и др.
Заинтересовани могу погледати програм радионице на адреси: https://www.distant-reading.net/call-for-belgrade-training-school-exploring-eltec-use-cases-for-information-extraction-and-analysis/
Заинтересовани за српску колекцију романа дигитализованих у оквиру акције Distant Reading могу прочитати више о томе у последњем броју часописа Инфотека, посвећеном у целости српској колекцији дигитализованих романа: https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/issue/view/21