Outils Linguistiques 

La première partie du cours introduit à la linguistique des corpus : la constitution d’un corpus, la transcription, la tokenisation, la lemmatisation, l'annotation morphosyntaxique.

Dans la deuxième partie du cours, à travers la prise en main de l’outil Sketch-Engine, les étudiants apprennent à maîtriser les techniques d’exploration de grandes masses de données linguistiques. Une étude de cas est proposée. En 2015-16, par exemple, les étudiants ont été invités à observer les différences distributionnelles et sémantiques entre les constructions espèce de et sorte de en français contemporain (corpus frTenTEn, 12 miliards de mots). Les résultats de l’étude sont décrits dans ces trois dossiers rédigés par les étudiantes L3 :

Marianne Buisson

Valentine Fassi

Paloma Santi

.