senior advisor, senior research fellow
Institute for Language Technologies and Applied Linguistics
Tamás VÁRADI•Publications
Filter setting
189 results
189 results
189 results
Madarász, Gábor, András Holl, Noémi Ligeti-Nagy, Zijian Győző Yang, and Tamás Váradi. 2025. Text cleaning with transformer language models for Hungarian. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XXI. Magyar Számítógépes Nyelvészeti Konferencia. online kiadás: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 123–135.
Yang Zijian Győző, Dodé Réka, Ferenczi Gergő, Hatvani Péter, Héja Enikő, Lengyel Mariann, Ligeti-Nagy Noémiet al.. 2025. PULI LlumiX modell: Egy folytatólagosan előtanított nagy nyelvi modell. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XXI. Magyar Számítógépes Nyelvészeti Konferencia. online kiadás: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 153–167.
Ligeti-Nagy, Noémi, Gergő Ferenczi, Enikő Héja, László János Laki, Noémi Vadász, Zijian Győző Yang, and Tamás Váradi. 2024. HuLU: Hungarian Language Understanding Benchmark Kit. In: Calzolari Nicoletta, Kan Min-Yen, Hoste Veronique, Lenci Alessandro, Sakti Sakriani, Xue Nianwen (szerk.) Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024): Main Conference Proceedings. Online kiadás: European Language Resources Association (ELRA). 8360–8371.
Madarász, Gábor, Noémi Ligeti-Nagy, András Holl, and Tamás Váradi. 2024. OCR Cleaning of Scientific Texts with LLMs. In: Rehm Georg, Dietze Stefan, Schimmler Sonja, Krüger Frank (szerk.) Natural Scientific Language Processing and Research Knowledge Graphs: First International Workshop, NSLP 2024, Hersonissos, Crete, Greece, May 27, 2024, Proceedings. Cham: Springer Nature Switzerland. 49–58. Paper: Chapter 4. https://doi.org/10.1007/978-3-031-65794-8_4.
Yang Zijian Győző, Dodé Réka, Héja Enikő, Laki László János, Ligeti-Nagy Noémi, Madarász Gábor, Váradi Tamás. 2024. ParancsPULI: Az utasításkövető PULI-modell. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XX. Magyar Számítógépes Nyelvészeti Konferencia. online kiadás: Szegedi Tudományegyetem. 61–72.
Yang, Zijian Győző, Réka Dodé, Gergő Ferenczi, Péter Hatvani, Enikő Héja, Gábor Madarász, Noémi Ligeti-Nagyet al.. 2024. The First Instruct-Following Large Language Models for Hungarian. In: András Hajdu 2024 IEEE 3rd Conference on Information Technology and Data Science (CITDS) Proceedings. Piscataway (NJ): Institute of Electrical and Electronics Engineers (IEEE). 247–252.
Ligeti-Nagy Noémi, Héja Enikő, Takács Dávid, Yang Zijian Győző, Váradi Tamás. 2023. Hát te mekkorát nőttél! – A HuLU első életéve új adatbázisokkal és webszolgáltatással. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XIX. Magyar Számítógépes Nyelvészeti Konferencia, MSZNY-2023. Szeged: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 217–230.
Ligeti-Nagy, Noémi, Réka Dodé, Kinga Jelencsik-Mátyus, Zsófia Varga, Enikő Héja, and Tamás Váradi. 2023. A new ParlaMint corpus for Hungarian 30m tokens of annotated parliamentary data. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XIX. Magyar Számítógépes Nyelvészeti Konferencia, MSZNY-2023. Szeged: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 433–446.
Yang Zijian Győző, Dodé Réka, Ferenczi Gergő, Héja Enikő, Kőrös Ádám, Laki László János, Ligeti-Nagy Noémi, Jelencsik-Mátyus Kinga, Vadász Noémi, Váradi Tamás. 2023. Jönnek a nagyok! BERTLarge, GPT-2 és GPT-3 nyelvmodellek magyar nyelvre. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XIX. Magyar Számítógépes Nyelvészeti Konferencia, MSZNY-2023. Szeged: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 247–262.
Laki László János, Kőrös Ádám, Ligeti-Nagy Noémi, Nyéki Bence, Vadász Noémi, Yang Zijian Győző, Váradi Tamás. 2022. OCR-hibák javítása neurális technológiák segítségével. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XVIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2022. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 417–430.
Ligeti-Nagy Noémi, Ferenczi Gergő, Héja Enikő, Jelencsik-Mátyus Kinga, Laki László János, Vadász Noémi, Yang Zijian Győző, Váradi Tamás. 2022. HuLU: magyar nyelvű benchmark adatbázis kiépítése a neurális nyelvmodellek kiértékelése céljából. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XVIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2022. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 431–446.
Váradi, Tamás, Bence Nyéki, Svetla Koeva, Marko Tadić, Vanja Štefanec, Maciej Ogrodniczuk, and Bartłomiej Nitoń. 2022. Introducing the CURLICAT Corpora: Seven-language Domain Specific Annotated Corpora from Curated Sources. In: Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC 2022). 100–108.
Váradi, Tamás, Marko Tadić, Svetla Koeva, Maciej Ogrodniczuk, Dan Tufiş, Radovan Garabík, Simon Krek, and Andraž Repar. 2022. Curated Multilingual Language Resources for CEF AT (CURLICAT): overall view. In: Macken Lieve, Rufener Andrew, Van den Bogaert Joachim, Daems Joke, Tezcan Arda, Vanroy Bram, Fonteyne Margot (szerk.)et al. Proceedings of the 23rd Annual Conference of the European Association for Machine Translation. Ghent: European Association for Machine Translation. 341–342.
Yang Zijian Győző, Feldmann Ádám, Váradi Tamás. 2022. A kis HIL-ELECTRA, HIL-ELECTRIC és HIL-RoBERTa: Magyar kísérleti nyelvi modellek tanítása kevés erőforrással. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XVIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2022. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 603–617.
Feldmann Ádám, Hajdu Róbert, Indig Balázs, Sass Bálint, Makrai Márton, Mittelholcz Iván, Halász Dávid, Yang Zijian Győző, Váradi Tamás. 2021. HILBERT, magyar nyelvű BERT-large modell tanítása felhő környezetben. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XVII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2021. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 29–36.
Martelli, Federico, Roberto Navigli, Simon Krek, Jelena Kallas, Polona Gantar, Svetla Koeva, Sanni Nimbet al.. 2021. Designing the ELEXIS Parallel Sense-Annotated Dataset in 10 European Languages. In: Kosem Iztok, Cukr Michal, Jakubíček Miloš, Kallas Jelena, Krek Simon, Tiberius Carole (szerk.) Electronic lexicography in the 21st century: post-editing lexicography. Brno: Lexical Computing. 377–395.
Váradi Tamás. 2021. Paradigmaváltás a nyelvtechnológiában?: Plenáris előadás. In: Bátyi Szilvia, Vígh-Szabó Melinda (szerk.) XXVIII. MAGYAR ALKALMAZOTT NYELVESZETI KONGRESSZUS: Nyelvek, nyelvváltozatok, következmények (absztraktfüzet). Veszprém: Magyar Alkalmazott Nyelvészek és Nyelvtanárok Egyesülete (MANYE); Pannon Egyetem Modern Filológiai és Társadalomtudományi Kar. 4.
Yang, Zijian Győző, and Tamás Váradi. 2021. Training language models with low resources: RoBERTa, BART and ELECTRA experimental models for Hungarian. In: (szerk.) 12th IEEE International Conference on Cognitive Infocommunications (CogInfoCom 2021): proceedings. Online kiadás: Institute of Electrical and Electronics Engineers (IEEE). 279–285.
Ahmadi, Sina, John Philip McCrae, Sanni Nimb, Fahad Khan, Monica Monachini, Bolette Pedersen, Thierry Declercket al.. 2020. A Multilingual Evaluation Dataset for Monolingual Word Sense Alignment. In: Calzolari Nicoletta, Béchet Frédéric, Blache Philippe, Choukri Khalid, Cieri Christopher, Declerck Thierry, Goggi Sara (szerk.)et al. Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020). Párizs: European Language Resources Association (ELRA). 3232–3242. https://doi.org/10.13025/v0mx-x745.
Kupietz, Marc, N. Diewald, B. Trawiński, R. Cosma, D. Cristea, D. Tufiş, Tamás Váradi, and Angelika Wöllstein. 2020. Recent developments in the European Reference Corpus (EuReCo). In: Granger Sylviane, Lefer Marie-Aude (szerk.) Translating and Comparing Languages: Corpus-based Insights: Selected Proceedings of the Fifth Using Corpora in Contrastive and Translation Studies Conference. Louvain: Presses universitaires de Louvain. 257–273.
Rehm, Georg, Katrin Marheinecke, Stefanie Hegele, Stelios Piperidis, Kalina Bontcheva, Jan Hajič, Khalid Choukriet al.. 2020. The European Language Technology Landscape in 2020: Language-Centric and Human-Centric AI for Cross-Cultural Communication in Multilingual Europe. In: Calzolari Nicoletta, Béchet Frédéric, Blache Philippe, Choukri Khalid, Cieri Christopher, Declerck Thierry, Goggi Sara (szerk.) Proceedings of the Twelfth Language Resources and Evaluation Conference. Paris: European Language Resources Association (ELRA). 3322–3332.
Váradi, Tamás, Koeva Svetla, Yalamov Martin, Tadić Marko, Sass Bálint, Nitoń Bartłomiej, Ogrodniczuk Maciejet al.. 2020. The MARCELL Legislative Corpus. In: Calzolari Nicoletta, Béchet Frédéric, Blache Philippe, Choukri Khalid, Cieri Christopher, Declerck Thierry, Goggi Sara (szerk.)et al. Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020). Párizs: European Language Resources Association (ELRA). 3761–3768.
Kovács, György, Tamás Grósz, and Tamás Váradi. 2019. Using Deep Rectifier Neural Nets and Probabilistic Sampling for Topical Unit Classification. In: Klempous Ryszard, Nikodem Jan, Baranyi Péter Zoltán (szerk.) Cognitive Infocommunications, Theory and Applications. Cham: Springer Netherlands. 1–24. https://doi.org/10.1007/978-3-319-95996-2_1.
Ferenczi, Zsanett, Iván Mittelholcz, Eszter Simon, and Tamás Váradi. 2018. Evaluation of Dictionary Creating Methods for Finno-Ugric Minority Languages. In: Nicoletta Calzolari, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Koiti Hasida, Hitoshi Isahara (szerk.)et al. Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Paris: European Language Resources Association (ELRA). 1989–1994.
Hunyadi, Laszlo, Tamás Váradi, György Kovács, István Szekrényes, Hermina Kiss, and Karolina Takács. 2018. Human-human, human-machine communication: on the HuComTech multimodal corpus. In: Skadina Inguna, Eskevich Maria (szerk.) Selected papers from the CLARIN Annual Conference 2018, Pisa, 8-10 October 2018. Linköping: Linköping University Electronic Press. 56–65.
Kupietz, Marc, Ruxandra Cosma, Dan Cristea, Nils Diewald, Beata Trawiński, Dan Tufiş, Tamás Váradi, and Angelika Wöllstein. 2018. Recent developments in the European Reference Corpus (EuReCo). In: Sylviane Granger, Marie-Aude Lefer (szerk.) Translating and comparing languages: corpus-based insights : proceedings of the Fifth Using Corpora in Contrastive and Translation Studies Conference. Louvain-la-Neuve: Université Catholique de Louvain (UCL). 101–103.
Váradi, Tamás, Eszter Simon, Bálint Sass, Iván Mittelholcz, Attila Novák, Balázs Indig, Richárd Farkas, and Veronika Vincze. 2018. E-magyar -- A Digital Language Processing System. In: Nicoletta Calzolari, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Koiti Hasida, Hitoshi Isahara (szerk.)et al. Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Paris: European Language Resources Association (ELRA). 1307–1312.
Fürbacher, Monica, Tamás Váradi, and Andreas Witt. 2017. Digitale Forschungsinfrastrukturen: ihre Nutzung durch die Mitglieder der Europäischen Föderation Nationaler Sprachinstitutionen. In: Dabrowska-Burkhardt Jarochna, Eichinger Ludwig M., Itakura Uta (szerk.) Deutsch: lokal - regional - global. Tübingen: Narr Francke Attempto Verlag. 103–113.
Kovács György, Váradi Tamás. 2017. A különböző modalitások hozzájárulásának vizsgálata a témairányítás eseteinek osztályozásához a HuComTech korpuszon. In: Vincze Veronika (szerk.) XIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2017: Szeged, 2017. január 26-27. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 193–204.
Kupietz, Marc, Andreas Witt, Piotr Bański, Dan Tufiş, Dan Cristea, and Tamás Váradi. 2017. EuReCo-Joining Forces for a European Reference Corpus as a sustainable base for cross-linguistic research. In: Bański Piotr, Kupietz Marc, Lüngen Harald, Rayson Paul, Biber Hanno, BreitenederEvelyn, Clematide Simon, Mariani John, Stevenson Mark, Sick Theresa (szerk.) Proceedings of the workshop on challenges in the management of largecorpora and big data and natural language processing (CMLC-5+BigNLP)2017 including the papers from the web-as-corpus (WAC-XI) guest section. Zürich: University of Zurich. 15–19.
Váradi Tamás (szerk.). 2017. 11. Alkalmazott Nyelvészeti Doktoranduszkonferencia: AlkNyelvDok. Budapest: MTA Nyelvtudományi Intézet.
Váradi Tamás, Simon Eszter, Sass Bálint, Gerőcs Mátyás, Mittelholcz Iván, Novák Attila, Indig Balázs, Prószéky Gábor, Farkas Richárd, Vincze Veronika. 2017. Az e-magyar digitális nyelvfeldolgozó rendszer. In: Vincze Veronika (szerk.) XIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2017: Szeged, 2017. január 26-27. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 49–60.
Kovács, György, Tamás Grósz, and Tamás Váradi. 2016. Topical unit classification using deep neural nets and probabilistic sampling. In: Baranyi Péter, Sallao Gyula (szerk.) 7th IEEE Conference on Cognitive Infocommunications - COGINFOCOM 2016: Proceedings. Budapest: IEEE Hungary Section. 199–204. https://doi.org/10.1109/CogInfoCom.2016.7804549.
László, Hunyadi, Váradi Tamás, and Szekrényes István. 2016. Language technology tools and resources for the analysis of multimodal communication. In: Erhard Hinrichs, Marie Hinrichs, Thorsten Trippel (szerk.) Proceedings of the Workshop on Language Technology Resources and Tools for Digital Humanities (LT4DH 2016). Tübingen: University of Tübingen. 117–124.
Rehm, Georg, Hans Uszkoreit, Sophia Ananiadou, Núria Bel, Audronė Bielevičienė, Lars Borin, António Brancoet al.. 2016. The strategic impact of META-NET on the regional, national and international level. LANGUAGE RESOURCES AND EVALUATION 50, 2: 351–374.
Benyeda Ivett, Koczka Péter, Ludányi Zsófia, Simon Eszter, Váradi Tamás. 2015. Finnugor nyelvű közösségek nyelvtechnológiai támogatása online tartalmak létrehozásában. In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.) XI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2015: Szeged, 2015. január 15-16. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 133–144.
Márton, Miháltz, Váradi Tamás, Csertő István, Fülöp Éva, Pólya Tibor, and Kővágó Pál. 2015. Beyond Sentiment: Social Psychological Analysis of Political Facebook Comments in Hungary. In: Proceedings of the 6th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis (WASSA 2015). Association for Computational Linguistics (ACL). 127–133.
Miháltz Márton, Váradi Tamás. 2015. TrendMiner: politikai témájú közösségimédia-üzenetek feldolgozása és szociálpszichológiai elemzése. In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.) XI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2015: Szeged, 2015. január 15-16. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 195–197.
Miháltz, Márton, and Tamás Váradi. 2015. TrendMiner: Large-Scale Analysis of Political Attitudes in Public Facebook Messages. In: (szerk.) 2015 6th IEEE International Conference on Cognitive Infocommunications (CogInfoCom): Proceedings of a meeting held 19-21 October 2015, Győr, Hungary. New York: Institute of Electrical and Electronics Engineers (IEEE). 265–266. https://doi.org/10.1109/CogInfoCom.2015.7390601.
Oravecz Csaba, Sass Bálint, Váradi Tamás. 2015. Mennyiségbõl minõséget: Nyelvtechnológiai kihívások és tanulságok az MNSz új változatának elkészítésében. In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.) XI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2015: Szeged, 2015. január 15-16. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 109–121.
Pólya Tibor, Csertő István, Fülöp Éva, Kővágó Pál, Miháltz Márton, Váradi Tamás. 2015. A véleményváltozás azonosítása politikai témájú közösségi médiában megjelenő szövegekben. In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.) XI. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2015: Szeged, 2015. január 15-16. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 198–209.
Dagmar, Jung, Klessa Katarzyna, Zsuzsanna Duray, Beatrix Oszkó, Mária Sipos, Sándor Szeverényi, Zsuzsa Várnai, Paul Trilsbeek, and Tamás Váradi. 2014. Languagesindanger.eu - Including Multimedia Language Resources to disseminate Knowledge and Create Educational Material on less-Resourced Languages. In: Calzolari Nicoletta, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Asunción Moreno, Jan Odijk, Stelios Piperidis (szerk.) LREC 2014 - NINTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION. Lisbon: European Language Resources Association (ELRA). 530–535.
Georg, Rehm, Uszkoreit Hans, Ananiadou Sophia, Bel Núria, Bielevičiené Audroné, Borin Lars, Branco Antónioet al.. 2014. The Strategic Impact of META-NET on the Regional, National and International Level. In: Calzolari Nicoletta, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Asunción Moreno, Jan Odijk, Stelios Piperidis (szerk.) LREC 2014 - NINTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION. Lisbon: European Language Resources Association (ELRA). 1517–1524.
Georg, Rehm, Uszkoreit Hans, Dagan Ido, Goetcherian Vartkes, Ugur Dogan Mehmet, Mermer Coskun, Varadi Tamáset al.. 2014. An update and extension of the META-NET Study “Europe’s Languages in the digital age”. In: Proceedings of the Workshop on Collaboration and Computing for Under-Resourced Languages in the Linked OpenData Era. 1–8.
Oravecz, Csaba, Tamás Váradi, and Bálint Sass. 2014. The Hungarian Gigaword Corpus. In: Calzolari Nicoletta, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Asunción Moreno, Jan Odijk, Stelios Piperidis (szerk.) LREC 2014 - NINTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION. Lisbon: European Language Resources Association (ELRA). 1719–1723.
Pajzs, Júlia, Ralf Steinberger, Maud Ehrmann, Mohamed Ebrahim, Leonida Della Rocca, Stefano Bucci, Eszter Simon, and Tamás Váradi. 2014. Media monitoring and information extraction for the highly inflected agglutinative language Hungarian. In: Calzolari Nicoletta, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Asunción Moreno, Jan Odijk, Stelios Piperidis (szerk.) LREC 2014 - NINTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION. Lisbon: European Language Resources Association (ELRA). 2049–2056.
Váradi Tamás, Mittelholcz Iván, Blága Szabolcs, Harmati Sebestyén. 2014. Magyar társadalomtudományi citációs adatbázis: A MATRICA projekt eredményei. In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.) X. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2014. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 269–279.
Váradi Tamás. 2013. helyesírás.mta.hu: Helyesírási tanácsadó portál. ÉDES ANYANYELVÜNK 35, 4: 17.
Váradi, T. 2013. Veni Vidi, Vici: The Language Technology Infrastructure Landscape after CESAR. In: Gajdsová, Zaková (szerk.) SLOVKO 2013: Natural Language Processing, Corpus Linguistics, E-Learning. Slovak National Corpus. Bratislava: Slovak Academy of Sciences. 261–279.
Declerck, T, P Lendvai, K Mörth, G Budin, and T Váradi. 2012. Towards Linked Language Data for Digital Humanities. In: Christian Chiarcos, Sebastian Hellmann, Sebastian Nordhoff (szerk.) Linked Data in Linguistics: Representing and Connecting Language Data and Language Metadata. Frankfurt am Main: Springer Netherlands. 109–116.
Declerck, T, P Lendvai, N Koleva, and T Váradi. 2012. Integration of Ontological Semantic Resources in NooJ. In: Kristina Vučković, Božo Bekavac, Max Silberztein (szerk.) Automatic Processing of Various Levels of Linguistic Phenomena:: Selected Papers from the NooJ 2011 International Conference. Cambridge: Cambridge Scholars Publishing. 195–204.
Ehmann, B, P Lendvai, T Pólya, O Vincze, M Miháltz, L Tihanyi, T Váradi, and J László. 2012. Narrative Psychological Application of Semantic Role Labeling. In: Kristina Vučković, Božo Bekavac, Max Silberztein (szerk.) Automatic Processing of Various Levels of Linguistic Phenomena:: Selected Papers from the NooJ 2011 International Conference. Cambridge: Cambridge Scholars Publishing. 218–228.
Silberztein, M, T Váradi, and M Tadić. 2012. Open source multi-platform NooJ for NLP. In: Proceedings of the 24th International Conference on Computational Linguistics, COLING 2012. 401–408.
Tadić, M, and T Váradi. 2012. Central and South-East European Resources in META-SHARE. In: Proceedings of the 24th International Conference on Computational Linguistics, COLING 2012. 431–438.
Vučković, K, M Silberztein, and T Varadi. 2012. Corpus Analysis with NooJ. In: Calzolari Nicoletta, Choukri Khalid, Declerck Thierry, Uğur Doğan Mehmet, Maegaard Bente, Mariani Joseph, Odijk Jan, Piperidis Stelios (szerk.) Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12). Istanbul: European Language Resources Association (ELRA). Paper: 581314.
Ehmann Bea, Lendvai Piroska, Vincze Orsolya, Tihanyi László, Váradi Tamás, László János. 2011. Labeling the Roles of Agent and Undergoer in NooJ for Narrative Psychological Applications.
Ehmann, Bea, Piroska Lendvai, Tibor Pólya, Orsolya Vincze, Márton Miháltz, László Tihanyi, Tamás Váradi, and János László. 2011. Narrative Psychological Application of Semantic Role labeling.
Lendvai, P, T Váradi, S Darányi, and T Declerck. 2011. Assignment of Character and Action Types in Folk Tales. In: NooJ Conference. Paper: 2010.
Moeth, K, T Declerck, P Lendvai, and T Váradi. 2011. Accessing Multilingual Data on the Web for the Semantic Annotation of Cultural Heritage Texts. In: Montiel-Ponsoda E, McCrae J, Buitelaar P, Cimiano P (szerk.) Proceedings of the 2nd International Workshop on the Multilingual Semantic Web. Berlin: Springer Netherlands. 6. Paper: 9.
Váradi, T, and E Héja. 2011. Multilingual term extraction from parallel corpora - A methodology for the automatic extraction of verbal structures and their translation equivalents. MAGYAR TERMINOLÓGIA 4, 2: 226–237.
Váradi, T, R Garabík, S Koeva, M Ogrodniczuk, M Tadić, and D Vitas. 2011. Detecting Gaps in Language Resources and Tools in the Project CESAR. In: 5th Language & Technology Conference. Paper: 559516.
Váradi, T. 2011. Introducing the CESAR project. INFOTHECA 12: 1.
Sass Bálint, Váradi Tamás, Pajzs Júlia, Kiss Margit (szerk.). 2010. Magyar igei szerkezetek: A leggyakoribb vonzatok és szókapcsolatok szótára. Budapest: Tinta Könyvkiadó.
Váradi T, Peredy M, Oravecz Cs. 2010. Nyelvtechnológiai módszerek a Budapesti Szociolingvisztikai Interjú lexikai és szintaktikai vizsgálatában. In: Tanács Attila, Vincze Veronika (szerk.) VII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2010: Szeged, 2010. december 2-3. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 300–313.
Váradi, T. 2009. Bringing language technology to the masses: Some thoughts on the Hungarian online spelling dictionary project. In: Hlaváčková D, Horák A, Osolsobě K, Rychlý P (szerk.) After Half a Century of Slavonic Natural Language Processing. 227–232.
Miháltz, Márton, Csaba Hatvani, Judit Kuti, György Szarvas, János Csirik, Gábor Prószéky, and Tamás Váradi. 2008. Methods and Results of the Hungarian WordNet Project. In: Tanács Attila, Csendes Dóra, Vincze Veronika, Fellbaum Christiane, Vossen Piek (szerk.) Proceedings of the Fourth Global WordNet Conference (GWC 2008). Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 311–321.
Pusztai F, Kemény G, Váradi T. 2008. Magyar értelmező szótár hangos CD-vel. Budapest: Akadémiai Kiadó.
Váradi, T, S Krauwer, P Wittenburg, M Wynne, and K Koskenniemi. 2008. CLARIN: common language resources and technology infrastructure.. In: Calzolari N, Choukri K, Maegaard B, Mariani J, Odjik J, Piperidis S, Tapias D (szerk.) Sixth International Conference on Language Resources and Evaluation (LREC). Paris: European Language Resources Association (ELRA). 1244–1248.
Váradi, T, and G Kiss. 2007. Equivalence and Non-equivalence in Parallel Corpora. In: Teubert W (szerk.) Text corpora and Multilingual Lexicography (Benjamins Current Topics 8). Amsterdam: Benjamins. 147–157.
Váradi, T, V Nagy, and P Vajda. 2007. Hungarian Morphology in INTEX/Nooj. In: Koeva S, Maurel D, Silberztein M (szerk.) Formaliser les langues avec l'ordinateur: de Intex à Nooj : actes des sixièmes, Sofia 2003, et septièmes, Tours 2004, journées Intex-Nooj. Besançon: Presses universitaires de Franche-Comté. 121–126. Paper: 8.
Váradi, T. 2007. Fishing for translation equivalents using grammatical anchors. In: Teubert W, Krishnamurthy R (szerk.) Corpus Linguistics. Critical Concepts in Linguistics. New York: Routledge. 299–312.
Váradi, T. 2007. NP Modification Structures in Parallel Corpora. In: Anderman G, Rogers M (szerk.) Incorporating Corpora. The Linguist and the Translator. Clevedon: Multilingual Matters Ltd.. 168–187.
Váradi, T. 2005. Taking Stock of the Bilingual Lexicon. In: Corpus Linguistics 2005. Proceedings from the Conference, Vol. 1.
Csendes Dóra, Hatvani Csaba, Alexin Zoltán, Csirik János, Gyimóthy Tibor, Prószéky Gábor, Váradi Tamás. 2003. Kézzel annotált magyar nyelvi korpusz: a Szeged Korpusz. In: Alexin Z, Csendes D (szerk.) Magyar Számítógépes Nyelvészeti Konferencia I. : MSZNY 2003: Szeged, 2003 december 10-11. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 238–245.
Pusztai F, Gerstner K, Juhász J, Kemény G, Szőke I, Váradi T. 2003. Magyar értelmező kéziszótár. Budapest: Akadémiai Kiadó.
Senellart, J, P Dienes, and T Váradi. 2003. New generation systran translation system. In: Senellart J, Yang J, Rebollo A (szerk.) Proceedings of MT Summit IX.. Paper: 68.568.
Váradi, T. 2003. Shallow Parsing of Hungarian Business News. In: Proceedings of the Cracow Grid Workshop 3rd . Proceedings. 845–851.
Váradi, T. 2002. Building an English-Hungarian transfer dictionary. STUDIES IN LINGUISTICS: A SUPPLEMENT TO HUNGARIAN STUDIES IN ENGLISH 6, 2: 264–276.
Váradi, T. 2002. The Hungarian National Corpus. In: Maybury MT (szerk.) Proceedings of the 3rd LREC Conference. European Space Agency (ESA). 385–389.
Erjavec, T, and T Váradi. 2001. The TELRI tool catalogue: structure and prospects. In: Proceedings of the ACL 2001 Workshop on Sharing Tools and Resources. Toulouse, 2001. Toulouse: Association for Computational Linguistics (ACL). 6–11.
Senellart, J, P Dienes, and T Váradi (eds.). 2001. Development of a New Generation of Translation System in Proceedings of MT Summit VIII. Santiago, 2001 September, Santiago. Santiago: European Association for Machine Translation.
Senellart, J, P Dienes, and T Váradi. 2001. Development of a New Generation of Translation System. In: Senellart J, Dienes P, Váradi T (szerk.) Development of a New Generation of Translation System in Proceedings of MT Summit VIII. Santiago, 2001 September, Santiago. Santiago: European Association for Machine Translation. 1–7.
Váradi, T, and G Kiss. 2001. Equivalence and Non-equivalence in Parallel Corpora. INTERNATIONAL JOURNAL OF CORPUS LINGUISTICS 6, special issue: 167–177.
Tufis, D, P Dienes, CS Oravecz, and T Váradi. 2000. Principled Hidden Tagset Design for Tiered Tagging of Hungarian. In: Gavrilidou M (szerk.) Proceedings of the Second International Conference on Language Resources and Evaluation (LREC 2000). Paris: European Language Resources Association (ELRA). 1421–1426.
Váradi T. 2000. Modern nyelvi technológiák a magyar nyelvért. In: Kiefer Ferenc, Gósy Mária (szerk.) Helyzetkép a magyar nyelvtudományról: a Magyar Tudományos Akadémia Nyelvtudományi Intézete fennállásának 50. évfordulója alkalmából rendezett tudományos ülésen elhangzott előadások válogatott és átdolgozott tanulmányai. Budapest: MTA Nyelvtudományi Intézet. 146–156.
Váradi, T. 2000. Corpus Linguistics - Linguistics or Language Engineering?. In: Erjavec T, Gros J (szerk.) Proceedings of the conference Language Technologies 2000. Ljubljana: Institut Jožef Stefan. 1–5.
Váradi, T. 2000. Fishing for Translation Equivlaents Using Grammatical Anchors. INTERNATIONAL JOURNAL OF CORPUS LINGUISTICS 5, 1: 1–16.
Alexin, Z, T Váradi, Cs Oravecz, G Prószéky, J Csirik, and T Gyimóthy. 1999. FGT - A framework for generating rule-based taggers. In: Proceedings of the Ninth International Workshop on Inductive Logic Programming (ILP 99). Ljubljana: Josef Stefan Institute. 1–7.
Váradi, T, and CS Oravecz. 1999. Morphosyntactic ambiguity and tagset design for Hungarian. In: Vintar S (szerk.) Proceedings of the Workshop Language Technologies - Multilingual Aspects: 32nd Annual Meeting of the Societas Linguistica Europea, 1999. 8–12.
Váradi, T. 1999. On developing the Hungarian national corpus. In: Vintar S (szerk.) Proceedings of the Workshop Language Technologies - Multilingual Aspects: 32nd Annual Meeting of the Societas Linguistica Europea, 1999. 57–63.
Bátori, I, K Németh, and T Váradi. 1998. Computerwekzeuge für die Sprachforschung: Aufbau und Funktionen einer etymologischen Datenbasis für den gemeinsamen uralischen Wortbestand. STUDIA IRANICA, MESOPOTAMICA, ANATOLICA 27, 3: 3–14.
Váradi, T. 1998. From cards to computer files: Processing the data of the Budapest sociolinguistic interview. Budapest: MTA Nyelvtudományi Intézet.
Váradi, T. 1998. Manual of the Budapest Sociolinguistic Interview Data. In: Working Papers in Hungarian Sociolinguistics, No. 4. Budapest: MTA Nyelvtudományi Intézet.
Váradi, T. 1998. On the Spoken Corpus of the Budapest Sociolinguistic Interview. In: Roach P (szerk.) Proceedings of the Workshop on Speech Database Development for Central and Eastern European Languages, Granada, 1998. European Language Resources Association (ELRA). 47–52.
Garside, R, G Leech, and T Varadi. 1995. Manual of Information for the Lancaster Parsed Corpus: http://khnt.hit.uib.no/icame/manuals/LPC/LPC.PDF
Váradi, T. 1995. Stylistic variation and the (bVn) variable in the Budapest Sociolinguistic Interview. ACTA LINGUISTICA HUNGARICA 43: 295–309.
Váradi T, Kontra M. 1994. A stigmatizált magyar kijelentő mód társadalmi disztibúciójáról. LINGUISTICA: SERIES A: STUDIA ET DISSERTATIONES 16: 115–124.
Váradi, T. 1994. Hesitations between inessive and illative forms in Hungarian. In: Hunyadi L, Kontra M, Pléh CS (szerk.) Studies in apllied linguistics 1.. Debrecen: Kossuth Lajos Tudományegyetem (KLTE). 3–20.
Roach, P, G Knowles, S Arnfield, and T Váradi. 1993. MARSEC: a Machine-Readable Spoken English Corpus. JOURNAL OF THE INTERNATIONAL PHONETIC ASSOCIATION 23, 2: 47–53.
Sherwood P, Váradi T. 1993. A londoni magyar tanulói szótárról. HUNGAROLÓGIA : TUDOMÁNYOS OKTATÁSMÓDSZERTANI ÉS TÁJÉKOZTATÓ FÜZETEK 4: 101–135.
Váradi, T, R Garside, and G Leech. 1992. The Lancaster Parsed Corpus: A machine-readable syntactically-analyzed corpus of 144,000 words, available for distribution through ICAME
Váradi T, Kontra M. 1991. Suksükölő értelmiség. MOZGÓ VILÁG 17, 2: 61–71.
Váradi, T. 1989. Integrated Analysis of Foreign Language Learners' Speech as Revealed in Successive Reformulations of Messages. ANNALES UNIVERSITATIS SCIENTIARUM BUDAPESTINENSIS DE ROLANDO EÖTVÖS NOMINATAE - SECTIO LINGUISTICA 20: 201–264.
Váradi, T, R Garside, and G Leech. 1987. Manual of information to accompany the Lancaster parsed corpus