1: tu as pas le fichier finalement
2: je voulais le faire dans ce sens-là moi
3: et j' ai plus de mal de le faire comme toi
4: une entité
5: ah oui tu t' en sortiras mieux dans le sens là
6: responsable
7: oui oui oui oui
8: je voulais le faire dans le sens-là
9: responsable du contenu de la ressource le créateur
10: donc c' est bien
11: ah oui
12: ouais
13: respons~ responsable du contenu de la ressource
14: ouais de la fabrication va dire du contenu de la ressource
15: moi je le dis
16: on va dire
17: ça veut dire globalement ça
18: fichier
19: non hum ouais ouais il y a pas de souci
20: ouais
21: creator
22: c' est responsable du corpus
23: hum
24: donc
25: date
26: ben il y a date de l' enregistrement
27: hum
28: ouais
29: ouais
30: on n' a que ça comme date nous hein
31: non il y a les dates de naissance et caetera
32: mais il faut voir si on les met là ou
33: pas hum
34: non
35: à priori non moi je pense que c' est date du corpus un peu hein
36: date de l' enregistrement
37: par contre il y a date des révisions et tout ça
38: non hum hum
39: on n' a pas nous ça
40: non on n' a pas ça
41: non on a les noms des réviseurs
42: mais on n' a pas les dates
43: vous êtes sûres
44: bon d' accord
45: hum mais on pourrait aussi avoir euh par la suite date des annotations par exemple comme c' est le cas dans OLAC
46: ben je sais pas
47: bon enfin
48: en tout cas pour l' instant
49: hum on a juste
50: voilà
51: date de l' enregistrement
52: O K
53: alors
54: description description
55: moi j' imagine c' est un texte libre ça description
56: description oui description
57: donc ce serait commentaire divers chez nous
58: description
59: par exemple
60: euh description euh
61: oui voilà
62: ah non a description détaillée du lieu nous
63: alors attends je vais reprendre dans l' ordre
64: là c' est le contenu de la ressource
65: oui c' est ça
66: c' est un texte un texte sur la ressource
67: c' est quoi c' est celui qui est en rouge ou c' est celui qui est en bleu
68: non c' est celui là là
69: ah
70: d' accord
71: ouais c' est commentaire sur description
72: en fait on a des notes pour plein de trucs hein
73: on a s note sur l' enregistrement euh
74: ouais
75: donc tu l' as validée
76: note s sur la version des conventions de transcription s note sur la validité juridique au sens peut-être on s' en fout note s sur l' anonymisation description détaillée du lieu cadre situationnel
77: NNAAMMEE
78: situation d' énonciation
79: c' est pareil
80: d' accord
81: c' est pas s note sur l' enregistrement le lieu
82: et commentaires divers
83: ah non peut-être
84: pas c' est c' est c' est vague
85: c' est c' est sur le contenu de la ressource est
86: tout oui
87: hum mais on n' a pas un champ spécifique pour ça
88: il faudrait qu' on ait un champ
89: en fait il faudrait un résumé de la chose voilà
90: ouais un résumé
91: justement pourquoi tu veux qu' on rajoute un champ
92: parce que ça peut être utile d' avoir un résumé de du contenu de l' an-~ de la de la de l' enregistrement
93: mais on l' a pas quelque part ça
94: mais
95: si on a ça
96: mais si on a ça ça dépend ce que tu appelles par contenu
97: ben
98: c' est
99: oui qu' est-ce que tu entends
100: ce que tu appelles ouais
101: mais non un résumé
102: de bah
103: si il y a thème il y a thème du corpus
104: il y a thème abordé résumé ouais
105: thème abordé résumé
106: ouais ben voilà
107: c' est pas mal ça
108: c' est ça
109: voilà
110: allez vas-y
111: c' est
112: celui-là tu crois que c' est ça
113: oui sûr
114: ah ouais
115: sûr c' est un résumé de du succint du voilà
116: du contenu
117: ah d' accord
118: donc ça c' est le description
119: O K c' est euh description
120: O K
121: format
122: alors
123: mais euh
124: alors c' est c' est quoi C P U
125: c' est la taille
126: non c' est la c' est le c' est le C P U le utilisé
127: c' est
128: la donc c' est la taille du corpus
129: c' est ça
130: non non non
131: c' est C P U c' est pas
132: le c' est la-~ pff
133: on est pour la mémoire ordinateur utilisé pour euh
134: voilà
135: C P U c' est le processeur
136: travailler ta ressource
137: oui c' est tant de mégaoctets c' est ça
138: non c' est microprocesseur C P U
139: voilà
140: c' est-à-dire c' est quel ordinateur
141: tu as utilisé quoi en gros
142: je pense
143: parce que là c' est
144: alors ça c' est
145: non tu dois utiliser
146: c' est quel ordinateur
147: tu dois utiliser pour travailler avec ces ressources cette ressource
148: ça c' est certain
149: si tu as besoin de machine
150: ça on n' a
151: pas ça
152: on n' a pas ça
153: ouais
154: ça c' est sûr qu' on n' a pas nous hein
155: c' est ce que j' allais dire toutes ces choses~
156: là c' était
157: voilà
158: encoding
159: à part
160: le l' encoding ou le le makap là mak
161: markup
162: voilà markup format encoding il faut qu' on le rajoute
163: ou on l' a pas encore encodage
164: mais-ce que c' est nécessaire
165: oui et U T F
166: huit et caetera je pense qu' il faudra le rajouter
167: ouais ouais ça c' est sûr qu' on en aura
168: ah d' accord
169: mais celui-là on l' a pas encore
170: il faut qu' on rajoute un champ
171: ouais
172: on le met dans transcription
173: de quoi
174: eh ben attends encodage on l' a
175: pas on le met dans euh dans transcription
176: mais attends
177: l' encodage c' est où ça
178: là
179: quand est-ce qu' on pourra mettre T E I
180: format de la transcription
181: hein NNAAMMEE
182: et votre format de la transcription c' est T R S
183: et caetera
184: oui mais dans le format tu peux avoir T R S et puis non mais rajoutez un champ euh encodage
185: oui moi je pensais rajouter un champ encodage
186: non
187: mais dans ce coin-là quoi je veux dire
188: oui
189: tout à fait tu auras le le type d' ordinateur le type de mémoire d' ordinateur qui aura été utilisé pour travailler avec
190: on aura juste un champ
191: voilà entre convention et note par exemple
192: normalement on met pas on met pas
193: et
194: encoding alors
195: donc
196: encodage des caractères
197: on rajoute pas encodage des caractères ouais
198: oui mais c' est-à-dire c' est ça
199: et le format
200: tout court U T F huit ISO latin ANSI euh
201: c' est plus voilà c' est encodage format d' encodage
202: c' est pas T E I
203: tu sais les trucs qui font que quand tu ouvres un fichier texte chez toi tu vois euh des trucs bizarres
204: oui mais on le rajoute dans notre fiche signalétique
205: voilà
206: ouais
207: il faut qu' on le rajoute
208: et on et ça ça correspond à euh
209: format
210: format
211: format
212: format encoding
213: O K
214: format markup
215: pour les cent vingt pages
216: donc c' est format
217: format markup c' est quoi ça
218: c' est euh le système de balisage
219: hum hum d' accord
220: ben c' est T E I
221: ben on a le T R S
222: quand même
223: ouais
224: et alors
225: le balisage
226: non le markup skin
227: donc
228: en fait
229: la la le schéma
230: c' est donc c' est format de la transcription
231: le markup c' est la D T D
232: tu veux dire
233: c' est
234: le le format de la transcription ça rentre dans le markup
235: je pense
236: non je sais pas je sais pas ou T
237: R non non non non pour moi c' est le schéma
238: le schéma d' annotation
239: voilà le schéma d' annotation oui c' est ça markup skin
240: tu crois
241: oui donc ça on n' en a pas pour l' instant tant qu' on n' est pas en T E I
242: on n' en a
243: pas
244: non
245: si pour l' instant c' est T R S
246: si c' est la T E I c' est la T R S
247: c' est T R S
248: oui c' est
249: donc on met quoi le format de transcription
250: c' est T R S
251: pour l' instant c' est le format de la transcription
252: d' accord
253: format
254: de et entre parenthèses on peut mettre D T D
255: je pense que tu mets carrément la D T D de toute façon
256: attends tu peux pas mettre un schéma directement
257: si si si mais c' est que c' est même marqué schéma
258: ou trans
259: donc
260: la D T D
261: de machin machin
262: de euh
263: mais ça on l' a pas on l' a pas dans l' autre sens là pour le coup
264: bah
265: si on l' a on l' a le format de la transcription D T D
266: mais on n' a pas la la D T D de Transcriber qui est prévue
267: on a juste le format le signaler que c' est du T R S et pas autre chose
268: hum
269: d' accord
270: O S
271: ça donc ça on le rajoute ou pas ou ça correspond à quoi le mark~
272: le markup là
273: alors
274: ah hum
275: c' est format de transcription
276: format
277: de d' accord
278: puis on mettra D T D sous ol-~ la D T D sous OLAC
279: ouais sous OLAC
280: et T R S
281: O S on s' en cogne
282: non attends
283: c' c' est quoi O S
284: O S
285: c' est c' est Operating System
286: c' est le windows
287: et voilà c' est ça
288: et alors tout pour le ou on le met pas
289: on n' a
290: pas on s' en fout
291: on met
292: pas
293: mais on n' a pas ça
294: ouais
295: O K d' accord ça marche
296: et so~ source code c' est le la le langage de programmation pareil
297: donc
298: pour la ressource
299: python c' est un langage de programmation
300: ça python c' est vrai
301: oui
302: oui
303: oui
304: bah ça va être refait
305: python pardon
306: python comme dans les Monty
307: py-~ python
308: c' est comme dans les Monty python
309: ouais ouais
310: hum hum d' accord ça va hein
311: c' est plus joli
312: python
313: je vois pas ce que ça avoir à faire à un langage de programmation dans une ressource
314: ça dépend si la ressource est un outil
315: ou si c' est du
316: ah d' accord
317: hum
318: ben moi pas accord mais
319: mais nous on l' a
320: pas aqu-~ aque a que que a que que que
321: nous on l' a pas
322: en tout cas
323: non voilà
324: de l' année d' avant ils ont rien compris
325: identifieur s
326: euh je pense que c' est le nom du dossier contenant le corpus
327: alors oui
328: oui
329: ben on en a plusieurs en fait
330: mais le nom du dossier c' est
331: premier ben non c' est pas possible
332: ben
333: si attends
334: attends-tends-tends-tends-tends j' ai j' ai vu une autre fois
335: référencement du corpus
336: un champ juste
337: voilà
338: non non pour ma base
339: il faut que c' est soit
340: non mais attends
341: NNAAMMEE je te dis que c' est dans la fiche signalétique
342: oui
343: donc ça correspond à ton premier champ en fait
344: on a nom du dossier ici
345: et là on a nom du corpus
346: voilà
347: identifiant c' est le même
348: mais c' est le même
349: d' accord
350: donc on a deux instances de du même truc
351: ouais parce que là c' est pour les citations en fait
352: on a on a étiqueté le truc parce que là c' est uniquement un champ de citation
353: d' où
354: le troisième nom du corpus
355: voilà hum
356: il y en a pas parce que il y en a un autre
357: ah bon donc c' est i-
358: à la fin pour le citer
359: à la fin tu sais quand tu pour citer le truc là
360: ah oui
361: mais c' est des champs bloqués à la fin
362: oui d' accord
363: donc ça c' est identifieur d' accord
364: hum on a fait presque une page en langage
365: ça va être vite fait
366: ouais
367: langage euh
368: c' est
369: mais est-ce qu' on l' a le champ
370: corpus ouais
371: mais on a la réponse mais-ce qu' on a le champ
372: non on n' a pas le champ
373: non n' a pas le champ
374: si si on a le champ
375: où on a langue première et caetera
376: mais on a le champ dans les locuteurs
377: oui
378: dans les locuteurs
379: ah tu veux dire on n' a pas on n' a rien qui nous dit
380: se passe en français
381: on a statut français par défaut vu qu' on a fait que du
382: eh oui
383: non on n' a rien nous dit que le corpus il est en français
384: eh ben il faut rajouter le champ langue
385: ouais
386: langue du corpus
387: ouais oui oui
388: donc ça c' est à rajouter
389: si c' est à rajouter
390: si si c' est pour dire toujours français ça sert à rien
391: oui mais po-~ potentiellement on pourrait en avoir d' autres
392: oui c' est pour ça qu' on l' avait pas mis de toute façon
393: on l' avait pas mis parce qu' on
394: hum c' est qu' au départ par défaut on pensait qu' on faisait que du français
395: mais on sait jamais on fera autre chose
396: ben NNAAMMEE
397: peut-être il en a d' avant
398: oui
399: ben oui ben oui c' est ça
400: non mais non ses corpus sont en français de toute façon
401: c' est la langue maternelle qui va primer
402: oui mais rien nous dit que on peut absorber d' autres corpus qui ne sont pas du français
403: enfin c' est moins sachant qu' on travaille sur le français parlé
404: c' est plus difficile oui
405: bah oui mais écoutez voir sait-on
406: jamais mais avant av on peut faire de l' analyse contrastive
407: je ne sais pas moi
408: mouais ça ça coûte rien de rajouter le champ
409: sinon
410: mais euh attendez voir à quoi
411: ça nous sert de rajouter le champ dans la fiche signalétique
412: si de toute façon pour NNAAMMEE concernant nos corpus ça correspondra systématiquement
413: quand elle fera le passage d' une autre fiche à un truc OLAC à affecter la valeur français à langage
414: ah oui
415: si vous me dîtes si
416: si bah si un jour on a autre chose
417: voilà c' est du
418: tout à fait en tout cas pour l' instant on n' a
419: pas tu fais ta mauvaise tête
420: aujourd' hui mais non
421: mais
422: toi tu le tu tu tu tu le mettrais
423: pas tant qu' il n' y en a pas besoin je le mettrais pas je veux dire
424: il y a pas de raison
425: mais alors à ce moment-là tout ce qu' on fait ça sert à rien puisque notre fiche elle a été créée sur nos besoins
426: donc euh à quoi ça sert
427: de c' est un peu ce que je pense
428: je pense que la seul intérêt c' est de projeter sur euh sur OLAC
429: ce qui se projette bien
430: et
431: pour et laisser tomber le reste
432: d' accord on oublie le français
433: O K
434: moi c' est ce que je ferais hein
435: mais d' accord donc on laisse tomber le le la case
436: de
437: ben on le rajoute pas euh
438: ta fiche
439: oui
440: dans la fiche
441: c' est c' est exactement ce qu' a fait NNAAMMEE
442: c' est euh que ça soit dans ta fiche ou pas quand tu traduis en en en OLAC langage français
443: d' accord
444: hum
445: mais si vous me dîtes ça moi je mets ça
446: et euh
447: non non non non c' est
448: bon on change pas la fiche
449: c' est
450: c' est change
451: pas donc on change
452: pas autant l' encodage des caractères on est sûr que ça on en aura besoin
453: j' ai numéroté les lignes
454: vous avez pas le droit de rajouter
455: c' est ça qu' il veut pas qu' on change les lignes
456: parce que hé on en rajoute une déjà hein NNAAMMEE de ligne hein
457: eh mais là il a rien dit parce que
458: l' encodage des caractères alors là
459: c' est important
460: d' accord on a rajouté l' encodage des caractères
461: oui là tu vas te faire rater
462: en tout cas euh
463: mais on s' en fout c' est du X M L
464: on l' a en tête du fichier X M L
465: ça sert à rien
466: d' accord
467: donc voilà donc très bien on l' a
468: met quand même ou
469: pas
470: si ça rajoute une ligne
471: non ouais mais dans combien de temps on aura les fichiers en X M L dans combien de temps
472: on aura les fichiers en X M L
473: il est en train là
474: ils y sont déjà T R S
475: est du X M L
476: oui mais et il y a l' encodage des caractères dans le X M L
477: oui
478: si c' est pas marqué si c' est pas marqué c' est que oui sinon c' est marqué ce que c' est ou T R S
479: on
480: ah oui donc on a
481: mais oui bien sûr bah
482: donc c' est bon
483: alors on l' a
484: donc on n' a pas besoin de le mettre
485: ben plus besoin de le mettre dans la fiche
486: bon voilà
487: allez
488: on l' a il suffit d' aller le chercher dans la transcription de dans le fichier de transcription
489: donc on rajoute pas avant
490: il y est d' office
491: il faut le chercher euh dans en
492: comment j' ai pas dit que c' était nul
493: mais c' est
494: pas non
495: mais c' est difficile NNAAMMEE c' est difficile de après de faire la automatique
496: s' il faut le chercher ailleurs dans
497: une oh ben non ouais
498: mais ça c' est pas dur dans le dans le début du du fichier X M L T
499: R S
500: on peut s' arranger pour que ce soit toujours la même chose en U T F huit on n' est pas
501: oui si on met la même chose
502: ça ça c' est autre chose
503: oui mais ça c' est pas sûr
504: si on met si on fixe le champ ça c' est p~ c' est c' est c' est simple
505: mais il faut chercher dans un autre fichier ou
506: pour bon toujours le même fichier T R S ça va
507: quoi
508: d' accord
509: mais euh là en l' occurrence que je vais faire donc je prends ce fichier là
510: et je tu cherches le c' est le début là
511: c' est la première ligne c' est euh
512: oui mais tandis que là il faut chercher dans un autre fichier voir euh le machin juste pour un champ
513: ouais mais tu sais si on le fait sur la fiche signalétique ben d' abord en plus les fiches signalétiques
514: elles sont censées être remplies automatiquement deuxièmement
515: oui oui
516: ben
517: automatiquement
518: oui sur euh sur Internet
519: enfin
520: sur euh sur euh ordinateur
521: bon
522: alors
523: l' individu lambda
524: mettons moi il y a cinq ans je vois le champ encodage de caractères
525: tu sais pas hein
526: je reste bloquée
527: je veux bien
528: oh oui
529: je reste bloquée devant
530: et je sais pas quoi mettre
531: hum hum
532: je sais pas ce que c' est
533: moi il y a cinq ans je sais pas ce que c' est l' encodage des caractères
534: non mais moi il y a cinq ans et cinq ans encore encore
535: en plus je sais
536: toujours pas
537: ah oui d' accord très bien
538: très bien
539: donc il faut
540: je pense que ça en fait
541: il vaut mieux le laisser étiqueté par euh
542: c-~ enfin en fait en fonction de l' ordinateur
543: sur lequel tu vas lancer Transcriber
544: je pense que ça va se mettre ou en U T F huit ou en ISO
545: et caetera ah bon c' est comme ça NNAAMMEE
546: mais non mais
547: tu imagines le bordel
548: c' est pas systématique
549: mais ça peut varier selon la machine
550: mais même
551: quand comment elle est paramétrée ta machine sur laquelle tu es tu vois par défaut
552: tu as un encodage
553: dans chaque application
554: c' est quoi la la question
555: j' ai pas suivi le le débat de départ
556: l' encodage encodage
557: des caractères
558: par exemple voilà NNAAMMEE moi je sais pas je sais pas rentrer ce truc-là
559: je vais vous donner un exemple
560: oui ben on mettra on mettra
561: trois quatre euh
562: propositions
563: propositions
564: oui mais quand on sait pas oui mais tu sais
565: pas mais tu en mets une par défaut
566: et après tu en sélectionnes une autre
567: mais non mais tu sais
568: tu sais pas laquelle est la bonne
569: tu sais pas les remplir du tout
570: moi je sais pas hein remplir un truc comme ça
571: je te donne un exemple
572: j' ouvre mon fichier
573: mettons euh je veux faire ma fiche signalétique euh tout ça euh
574: j' ai mon ma transcription qui est faite mon corpus
575: il est prêt et tout
576: je veux le rentrer
577: je fais la fiche signalétique sur Internet d' accord
578: j' ai fait mon corpus sous mac
579: hum hum
580: oui
581: mon éditeur s~ de texte
582: sous mac il m' ouvre par défaut en en-~ en encodage macroman
583: par défaut je le sais maintenant parce que j' ai regardé mais avant je savais pas
584: donc par défaut c' est macroman
585: moi je le sais pas je vais sur Internet pour moi le formulaire
586: il avait toujours la même tête tout ça
587: je mets U T F huit mettons parce que j' ai retenu T F huit NNAAMMEE
588: elle reprend le truc
589: elle fait automatiquement et sur euh le moissonneur
590: on va afficher le corpus
591: est en U T F
592: huit en fait il est en macroman
593: ça veut dire que très dur à exploiter
594: hum
595: alors que si euh NNAAMMEE elle prend mon fichier de transcription qui est en X M L
596: là ce sera écrit que c' est pas U T F
597: huit
598: ce sera écrit mettons macroman
599: mais ça c' est autre chose
600: et elle peut l' extraire
601: et elle est sûre d' avoir la bonne information
602: si c' est moi qui l' a met
603: soit je sais pas la mettre
604: soit je me gourre
605: et
606: comme c' est
607: quand
608: même
609: un truc d' identification des corpus euh enfin
610: loin de nous euh
611: loin de quelqu' un qui pourrait nous dire
612: au fait j' arrive pas ouvrir le fichier machin
613: ouais
614: hum
615: je pense ça vaut le coup de pas f-~ de pas écrire de connerie parce que là ça enduit vraiment d' erreurs hein
616: si tu mets un mauvais encodage
617: ben moi de toute manière je saurais pas mettre
618: ça on est d' accord
619: mais en général dans les les balises
620: on te demande justement notamment quand tu encodes en T E I
621: on te demande le format de codage que tu utilises directement X M L
622: tiens ISO
623: et oui oui quand tu encodes quand tu encodes en T E I oui
624: mais si tu fais ta transcription sous T R S sous euh
625: oui mais je suis d' accord
626: mais à terme de toute façon ce sera automatique
627: oui mais à terme à terme il faut espérer qu' on ait standardisé tout ça
628: euh enfin je pense on n' a pas besoin de le mettre dans la