На Универзитету Paris-Saclay 16. и 17. марта одржан је скуп у оквиру COST акције UniDive CA21167: Universality, diversity and idiosyncrasy in language technology. На скупу су одржани различити састанци и сесије: заједнички и они посвећени појединим радним групама (WG 1–4), као и састанак водећег тима (core group).
На скупу је, на постер сесији, представљен и постер проф. др Цветане Крстев (проф. УБ ФФ у пензији, ЈЕРТЕХ), проф. др Ранке Станковић (УБ РГФ), др Александре Марковић (ИСЈ САНУ), под насловом Multiword Expressions – Comparative Analysis Based on Aligned Corpora.
Циљ рада је истраживање унутарјезичких и међујезичких сличности и разлика у употреби симила. Трагало се за разликама у изворном појму у различитим језицима, као и за различитим начинима за изражавање поређења (симили, суперлатив, сложеница и сл.). Истраживање је засновано на четири двојезична паралелизована корпуса углавном књижевних текстова, и то енглеског, француског, немачког, италијанског као првог и српског као другог језика (корпуси су претраживи и доступни регистрованим корисницима; више о томе в. у самом апстракту, фуснота 1).
Симили имају препознатљиву структуру: субјекат и објекат поређења, поредбени везник и основ поређења. У претходним радовима (Mitrović et al., 2020; Krstev 2021) сакупљено је 558 симила у српским књижевним текстовима и представљена њихова структура у виду коначних аутомата. Сваки од њих описује могуће лексичко-синтаксичке варијанте симила.
У раду је пажња усмерена на начин на који се симили преводе. Поређење које је у једном језику изражено у форми симила на други језик може и не мора бити преведено у истој форми. Тако се у италијанском често користи супералтив (…mi parve palidissimo : …изгледао ми је блед као крпа (Pirandello), у немачком сложенице (Zu einem schneeweiẞen Hemd… : Поред као снег беле кошуље… (Dor) итд.
За будуће истраживање предвиђено је проналажење још неких начина за изражавање поређења, као и додатна анотација корпуса (синтаксичка) у складу са препорукама Акције (Universal Dependencies, Parseme). Уочено је да превођење симила представља изазов за преводиоце, јер различити језици и културе могу имати разне начине за изражавање исте идеје, а уз то, неки симили могу бити одраз културно-историјских специфичности. Вишејезички лексикон с паралелизованим симилима, потврђен примерима, могао би да олакша превођење и машинско превођење.
Заинтересовани могу погледати програм скупа на линку: https://unidive.lisn.upsaclay.fr/doku.php?id=meetings:general_meetings:1st_unidive_general_meeting#program ).
Апстракт, постер и слајд налазе се на линку: https://unidive.lisn.upsaclay.fr/doku.php?id=meetings:2023-saclay:abstracts#session_a}