Adatforrások
Magyar Nemzeti Szövegtár
Célunk egy 100 millió szavas szövegkorpusz létrehozása volt, amely lehetőségeihez mérten reprezentatívan tartalmazza a mai magyar nyelv jellegzetes megnyilvánulásait.
A magyar nyelv nagyszótára
A magyar nyelv nagyszótára a magyar nyelvtudomány eddigi legnagyobb szótári vállalkozása. Történeti jellegű értelmező szótárként legfontosabb feladata a szavak jelentéstartalmának kibontása és e jelentések viszonyrendszerének ábrázolása. Műfajából következően nem csupán a mai nyelvállapot szókészletét tükrözi és elemzi a lexikográfia eszközeivel, hanem történeti dimenziót érvényesít, amikor az elmúlt csaknem 230 esztendő szókincséből merít.
Az uráli nyelvek mondattanának változása
A projekt egyik célja egy annotált adatbázis létrehozása volt udmurt, tundrai nyenyec, szinjai és szurguti hanti nyelvű, írott és beszélt nyelvi szövegekből, amely lehetővé teszi az uráli–orosz kontaktushatás kutatását.
Mazsola – a magyar igei bővítményszerkezet vizsgálata
Megtudhatja, hogy adott ige melletti adott (esetrag vagy névutó által meghatározott) bővítményi pozícióban milyen jellegzetes szavak jelenhetnek meg, legyen az vonzat vagy szabad bővítmény vagy az igével idiomatikus szerkezetet alkotó szó.
Moldvai magyar nyelvjárási szövegek Tánczos Vilmos gyűjtéséből
Tánczos Vilmos moldvai gyűjtése páratlan kincs nemcsak a néprajztudomány, hanem a magyar nyelvészeti kutatások számára is, hiszen a magyar nyelvészet régi adóssága a moldvai magyar nyelvjárások kutatására alkalmas, megfelelő pontossággal lejegyezett szövegkorpusz létrehozása
Ó- és középmagyar történeti magánéleti korpusz
A Történeti magánéleti korpusz (TMK) az 1772 előtti magánlevelekből és peres eljárások jegyzőkönyveiből épül fel. Elsősorban a történeti morfológiai és szociolingvisztikai kutatásokhoz kínál anyagot, de segítséget nyújt a történeti mondattani, pragmatikai és lexikológiai vizsgálatokhoz is.
Ómagyar korpusz
Kutatásaink elsősorban a mondatszerkezet kulcselemeinek, az ún. funkcionális projekcióknak a vizsgálatára összpontosultak, így foglalkoztunk az igeidők és az aspektus rendszerének, a mondatbevezetőknek, a névutók és határozóragok rendszerének, valamint a determinánsok rendszerének az átalakulásával.