Шири циљ пројекта је развој унапред обучених, општенаменских модела језика машинског учења за српски језик помоћу векторизације текста, као и изградња додатне инфраструктуре и пратећих алата који ће обезбедити дигитално укључивање српског језика. За постизање овог циља постављени су специфични циљеви:
О1. изградити статичну и контекстуалну (динамичку) векторизацију речи за српски језик;
О2. обучити моделе за српски језик како би се омогућило вишеслојно анотирање (морфосинтакса, препознавање и повезивање именованих ентитета, екстракција релација за прављење графикона знања, анализа осећања) ослањајући се на векторизацију текста;
О3. изградити скуп језичких модела за генерисање текста, четботови за одговоре на питања, сумирање;
О4. развој портал алата на српском језику и његове алате за специфичне задатке.
Специфични циљеви су директно мапирани са WP (Work package, Radni paket): O1↔WP1 i WP2, O2-O4↔WP3 , док WP4 има за циљ да допре до академске и пословне заједнице, а WP5 мора да обезбеди ефикасно управљање активностима, контролу квалитета и ризика, правне и друштвене аспекте.
СМАРТ
С: Предложени пројекат је специфичан (specific) јер припрема, обрађује и истражује језичке ресурсе за српски језик на нов начин, пружајући нов и вредан материјал за даљи развој NLP модела и алата. Са отвореним и лаким приступом подржаним отвореним материјалима за обуку, он доноси прилику академским круговима и индустрији да користе резултате пројекта ТЕСЛА као градивни блок за нове свестране апликације.
М: Сви резултати (скупови података са коментарима, лексички подаци, језички модели) су мерљиви (measurable), изражени у величини колекције текста, броју реченица или лексема са коментарима, броју уноса у лексикону, броју парова питања и одговора, обученим моделима који олакшава праћење напретка на локацији пројекта: прекретнице су пажљиво одређене, са свешћу о времену потребном за испуњавање сваке активности.
А: Имајући у виду да је један део ТЕСЛА тима био дубоко укључен у производњу и експлоатацију неколико српских корпуса, таговања, NER (Named entity recognition, Препознавање именованих ентитета) и word-embedding модела, и да има искуство у предложеним технологијама, шири и специфични циљеви О1–О4 су оствариви (achievable) и реалистични.
Р: Пројекат ТЕСЛА ће бити од великог значаја (relevance) за научну и ширу заједницу. Научна заједница може изнова да користи скупове података са коментарима за обуку других модела, док се модели могу користити као градивни блокови за сложена решења, а ће индустрија моћи да примени резултате пројекта на комерцијална решења. Шира заједница ће имати највише користи од развијеног веб портала са end-to-end решењем.
Т: Активности дефинисане у пројекту ТЕСЛА су благовремено (timely) планиране за испуњавање и спровођење утврђених прекретница.