@inproceedings{macaire-etal-2024-un,
title = "Un corpus multimodal alignant parole, transcription et s{\'e}quences de pictogrammes d{\'e}di{\'e} {\`a} la traduction automatique de la parole vers des pictogrammes",
author = "Macaire, C{\'e}cile and
Dion, Chlo{\'e} and
Arrigo, Jordan and
Lemaire, Claire and
Esperan{\c{c}}a-Rodier, Emmanuelle and
Lecouteux, Benjamin and
Schwab, Didier",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 31{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d`articles publi{\`e}s",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-trad.12/",
pages = "20--21",
language = "fra",
abstract = "La traduction automatique de la parole vers des pictogrammes peut faciliter la communication entre des soignants et des personnes souffrant de troubles du langage. Cependant, il n`existe pas de formalisme de traduction {\'e}tabli, ni d`ensembles de donn{\'e}es accessibles au public pour l`entra{\^i}nement de syst{\`e}mes de traduction de la parole vers des pictogrammes. Cet article pr{\'e}sente le premier ensemble de donn{\'e}es alignant de la parole, du texte et des pictogrammes. Ce corpus comprend plus de 230 heures de parole. Nous discutons de nos choix pour cr{\'e}er une grammaire adapt{\'e}e {\`a} des s{\'e}quences de pictogrammes. Cette derni{\`e}re s`articule autour de r{\`e}gles et d`un vocabulaire restreint. La grammaire r{\'e}sulte d`une {\'e}tude linguistique approfondie des ressources extraites du site Web d`ARASAAC. Nous avons ensuite valid{\'e} ces r{\`e}gles {\`a} l`issue de multiples phases de post-{\'e}dition par des annotateurs experts. Le corpus propos{\'e} est ensuite utilis{\'e} pour entra{\^i}ner un syst{\`e}me en cascade traduisant la parole vers des pictogrammes. L`ensemble du corpus est disponible gratuitement sur le site web d`Ortolang sous une licence non commerciale. Il s`agit d`un point de d{\'e}part pour la recherche portant sur la traduction automatique de la parole vers des pictogrammes."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="macaire-etal-2024-un">
<titleInfo>
<title>Un corpus multimodal alignant parole, transcription et séquences de pictogrammes dédié à la traduction automatique de la parole vers des pictogrammes</title>
</titleInfo>
<name type="personal">
<namePart type="given">Cécile</namePart>
<namePart type="family">Macaire</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Chloé</namePart>
<namePart type="family">Dion</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jordan</namePart>
<namePart type="family">Arrigo</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Claire</namePart>
<namePart type="family">Lemaire</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Emmanuelle</namePart>
<namePart type="family">Esperança-Rodier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benjamin</namePart>
<namePart type="family">Lecouteux</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Didier</namePart>
<namePart type="family">Schwab</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d‘articles publiès</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La traduction automatique de la parole vers des pictogrammes peut faciliter la communication entre des soignants et des personnes souffrant de troubles du langage. Cependant, il n‘existe pas de formalisme de traduction établi, ni d‘ensembles de données accessibles au public pour l‘entraînement de systèmes de traduction de la parole vers des pictogrammes. Cet article présente le premier ensemble de données alignant de la parole, du texte et des pictogrammes. Ce corpus comprend plus de 230 heures de parole. Nous discutons de nos choix pour créer une grammaire adaptée à des séquences de pictogrammes. Cette dernière s‘articule autour de règles et d‘un vocabulaire restreint. La grammaire résulte d‘une étude linguistique approfondie des ressources extraites du site Web d‘ARASAAC. Nous avons ensuite validé ces règles à l‘issue de multiples phases de post-édition par des annotateurs experts. Le corpus proposé est ensuite utilisé pour entraîner un système en cascade traduisant la parole vers des pictogrammes. L‘ensemble du corpus est disponible gratuitement sur le site web d‘Ortolang sous une licence non commerciale. Il s‘agit d‘un point de départ pour la recherche portant sur la traduction automatique de la parole vers des pictogrammes.</abstract>
<identifier type="citekey">macaire-etal-2024-un</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-trad.12/</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>20</start>
<end>21</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Un corpus multimodal alignant parole, transcription et séquences de pictogrammes dédié à la traduction automatique de la parole vers des pictogrammes
%A Macaire, Cécile
%A Dion, Chloé
%A Arrigo, Jordan
%A Lemaire, Claire
%A Esperança-Rodier, Emmanuelle
%A Lecouteux, Benjamin
%A Schwab, Didier
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d‘articles publiès
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G fra
%F macaire-etal-2024-un
%X La traduction automatique de la parole vers des pictogrammes peut faciliter la communication entre des soignants et des personnes souffrant de troubles du langage. Cependant, il n‘existe pas de formalisme de traduction établi, ni d‘ensembles de données accessibles au public pour l‘entraînement de systèmes de traduction de la parole vers des pictogrammes. Cet article présente le premier ensemble de données alignant de la parole, du texte et des pictogrammes. Ce corpus comprend plus de 230 heures de parole. Nous discutons de nos choix pour créer une grammaire adaptée à des séquences de pictogrammes. Cette dernière s‘articule autour de règles et d‘un vocabulaire restreint. La grammaire résulte d‘une étude linguistique approfondie des ressources extraites du site Web d‘ARASAAC. Nous avons ensuite validé ces règles à l‘issue de multiples phases de post-édition par des annotateurs experts. Le corpus proposé est ensuite utilisé pour entraîner un système en cascade traduisant la parole vers des pictogrammes. L‘ensemble du corpus est disponible gratuitement sur le site web d‘Ortolang sous une licence non commerciale. Il s‘agit d‘un point de départ pour la recherche portant sur la traduction automatique de la parole vers des pictogrammes.
%U https://aclanthology.org/2024.jeptalnrecital-trad.12/
%P 20-21
Markdown (Informal)
[Un corpus multimodal alignant parole, transcription et séquences de pictogrammes dédié à la traduction automatique de la parole vers des pictogrammes](https://aclanthology.org/2024.jeptalnrecital-trad.12/) (Macaire et al., JEP/TALN/RECITAL 2024)
ACL
- Cécile Macaire, Chloé Dion, Jordan Arrigo, Claire Lemaire, Emmanuelle Esperança-Rodier, Benjamin Lecouteux, and Didier Schwab. 2024. Un corpus multimodal alignant parole, transcription et séquences de pictogrammes dédié à la traduction automatique de la parole vers des pictogrammes. In Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d'articles publiès, pages 20–21, Toulouse, France. ATALA and AFPC.