La ressource multilingue C-ORAL-ROM fournit un ensemble de corpus comparable de langue spontanée des langues romanes principales, à savoir le français, l'italien, le portugais et l'espagnol. La ressource est le résultat du projet C-ORAL-ROM, qui a été entrepris par un consortium européen, coordonné par l'Université de Florence et financé dans le cadre du cinquième programme-cadre de l'UE. C-ORAL-ROM se compose de 772 textes parlés et 123: 27: 35 heures de discours. Quatre collections d'enregistrements comparables de sessions de discours spontanées italiennes, françaises, portugaises et espagnoles (environ 300 000 mots pour chaque langue) L’ensemble de la partie française a été mis à disposition du projet Orféo.
Corpus | CORALROM |
Nom du fichier | fpubdl14 |
Responsable(s) | Cresti |
Moneglia | |
Résumé | discussion sur le contenu des articles scientifiques |
Date de l'enregistrement | 04/06/2002 |
Durée de l'enregistrement | 00:01:29 |
Nature du signal | audio |
Qualité du son | enregistrement défectueux |
Anonymisation du signal | script Daniel Hirst |
Niveaux d'annotation | Annotation automatique |
Annotation | automatique |
Type | conversation |
Secteur | privé |
Interaction en milieu … | amical |
Modalité | oral |
Nombre de locuteurs | 2 |
Situation de l'enregistrement | face_à_face |
Adresse d'échantillon | /annis-sample/coralrom/fpubdl14.html |
Identiant du locuteur | CHR |
Âge du locuteur | 21-60 |
Sexe du locuteur | M |
Profession du locuteur | étudiant |
Niveau d'études du locuteur | études supérieures |
Lieu de naissance du locuteur | France, PACA, Marseille |
Identiant du locuteur | EST |
Âge du locuteur | 21-60 |
Sexe du locuteur | F |
Profession du locuteur | enseignant-chercheur |
Niveau d'études du locuteur | études supérieures |
Lieu de naissance du locuteur | France, PACA, Manosque |
Loading audio…
Error: You will not be able to do the read-along audio because your browser is not able to play MP3, Ogg, or WAV audio formats.
(It seems your browser does not support HTMLMediaElement.playbackRate
, so you will not be able to change the speech rate.)
EST: | dis-moi tu en es où dans ta présentation là pour septembre |
CHR: | pour septembre ben j' ai |
EST: | pas ouais tu viens à Lorient ou tu viens pas alors |
CHR: | ah pour la présentation de Lorient ouais je viens à Lorient donc on a fait un sujet avec Sandrine sur les appositions |
EST: | ouais |
CHR: | et en fait quoi non c' est elle et moi je m' occupe de la du côté informatique des recherches enfin d' extraction des appositions |
EST: | mais c' est c' est pas toi qui travailles sur les appositions sur ton petit logiciel que tu as mis au point |
CHR: | non non du tout ça rien a voir je vais utiliser Lox de Laurent là |
EST: | ouais |
CHR: | et je vais euh on va donc annoter avec Cordial et une fois qu' on aura tout ça on fera les extractions avec Lox et euh on verra si ça fonctionne enfin si ça peut fonctionner ou |
EST: | pas mh alors en fait on savait que vous aviez présenté un truc parce que j' ai vu NNAAMMEE NNAAMMEE mh mh il me dit ouais j' ai Laurent présente un truc j' ai vu WinLox alors j' ai dit mais non Laurent présente rien si si j' ai vu Winlox alors on était là mais purée qui c' est qui cite Winlox on s' est dit oh mais ça doit être Christophe ça va ça va c' est |
CHR: | bon oui enfin là on a on a encore pas mal de boulot à faire enfin c' est normal on a encore deux mois donc ça devrait ça devrait fonctionner |
EST: | oui moi aussi j' ai pas mal de boulot parce que sur le résumé nous allons montrer que tu vois et puis le reste que les résultats sont très intéressants |
CHR: | quoi ouais ouais évidemment ouais non mais là enfin on devrait on devrait on devrait s' en sortir le problème c' est comme c' est un phénomène a~ assez complexe l' apposition et qu' il y a pas eu beaucoup de publications euh au niveau du traitement automatique |
EST: | ouais |
CHR: | mh c' est pas sûr que ce soit possible en fait donc il faut il faut essayer de d' élaborer une stratégie un peu un peu compliquée pour voir si on arrive à faire quelque chose ou si vraiment c' est pas la peine |
EST: | ouais |
CHR: | voilà |
Nom fichier | Lien | Taille (octets) |
---|---|---|
fpubdl14.orfeo | fichier | 25954 |
fpubdl14.wav | fichier | 3958924 |
fpubdl14.xml | fichier | 3139 |
fpubdl14.txt | fichier | 2056 |
Tous les fichiers ci-dessus dans un fichier .zip.