ТЕСЛА Обрада српског језика као помоћ у лексикографском раду, 27. мај 2024. Конференција Лексикографски сусрети
Радионица је намењена свима које интересују савремене технике и методе у обради природних језика, посебно оне које могу помоћи у лингвистичким истраживањима и лексикографском раду. Како је радионица је првенствено намењена обради српског језика, полазници ће се прво упознати с ресурсима и алатима које је за српски језик развило Друштво за језичке ресурсе и технологије ЈеРТех, укључујући оне који се заснивају на векторској репрезентацији речи а који настају у склопу пројекта ТЕСЛА Фонда за науку Републике Србије.
Циљ радионице је да покаже полазницима како могу да користе једнојезичне и двојезичне корпусе Јертех-а, а потом и да креирају сопствене корпусе. Практичне вежбе обухватају постављање упита над корпусима, претрагу обележених ентитета, као и вишејезичну претрагу паралелних корпуса. Други део радионице је посвећен креирању и текстометријској анализи сопствених корпуса коришћењем алата TXM. За вежбе су припремљени текстови из корпуса српских романа (1840–1920) SrpELTeC и италијанско-српског корпуса књижевних текстова It-Sr-NER.
Материјал са радионице:
Организатори:
- Ранка Станковић (Универзитет у Београду – Рударско-геолошки факултет)
- Биљана Рујевић (Универзитет у Београду – Рударско-геолошки факултет)
- Михаило Шкорић (Универзитет у Београду – Рударско-геолошки факултет)
- Цветана Крстев (Друштво за језичке ресурсе и технологије – ЈеРТех)
- Душко Витас (Друштво за језичке ресурсе и технологије – ЈеРТех)
Датум:
- 27. 5. 2024. од 9.00 до 12.30
Место:
- Филолошки факултет, Сала за седнице, први спрат
- Распоред:
- 09.00 — Корпуси ЈеРТех-а и њихова претрага
- 09.30 — Коришћење модела и алата ЈеРТех-а
- 10.00 — Векторске репрезентације речи
- 10.30 — пауза
- 11.30 — Креирање корпуса коришћењем алата TXM
- 11.45 — Текстометријска анализа корпуса
Викилајв, 18-19. мај 2024.