@inproceedings{millour-etal-2017-vers,
title = "Vers une solution l{\'e}g{\`e}re de production de donn{\'e}es pour le {TAL} : cr{\'e}ation d`un tagger de l`alsacien par crowdsourcing b{\'e}n{\'e}vole (Toward a lightweight solution to the language resources bottleneck issue: creating a {POS} tagger for {A}lsatian using voluntary crowdsourcing)",
author = {Millour, Alice and
Fort, Kar{\"e}n and
Bernhard, Delphine and
Steibl{\'e}, Lucie},
editor = "Eshkol-Taravella, Iris and
Antoine, Jean-Yves",
booktitle = "Actes des 24{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 - Articles longs",
month = "6",
year = "2017",
address = "Orl{\'e}ans, France",
publisher = "ATALA",
url = "https://aclanthology.org/2017.jeptalnrecital-long.10/",
pages = "139--154",
language = "fra",
abstract = "Nous pr{\'e}sentons ici les r{\'e}sultats d`une exp{\'e}rience men{\'e}e sur l`annotation en parties du discours d`un corpus d`une langue r{\'e}gionale encore peu dot{\'e}e, l`alsacien, via une plateforme de myriadisation (crowdsourcing) b{\'e}n{\'e}vole d{\'e}velopp{\'e}e sp{\'e}cifiquement {\`a} cette fin : Bisame1 . La plateforme, mise en ligne en mai 2016, nous a permis de recueillir 15 846 annotations gr{\^a}ce {\`a} 42 participants. L'{\'e}valuation des annotations, r{\'e}alis{\'e}e sur un corpus de r{\'e}f{\'e}rence, montre que la F-mesure des annotations volontaires est de 0, 93. Le tagger entra{\^i}n{\'e} sur le corpus annot{\'e} atteint lui 82 {\%} d`exactitude. Il s`agit du premier tagger sp{\'e}cifique {\`a} l`alsacien. Cette m{\'e}thode de d{\'e}veloppement de ressources langagi{\`e}res est donc efficace et prometteuse pour certaines langues peu dot{\'e}es, dont un nombre suffisant de locuteurs est connect{\'e} et actif sur le Web. Le code de la plateforme, le corpus annot{\'e} et le tagger sont librement disponibles."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="millour-etal-2017-vers">
<titleInfo>
<title>Vers une solution légère de production de données pour le TAL : création d‘un tagger de l‘alsacien par crowdsourcing bénévole (Toward a lightweight solution to the language resources bottleneck issue: creating a POS tagger for Alsatian using voluntary crowdsourcing)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Alice</namePart>
<namePart type="family">Millour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karën</namePart>
<namePart type="family">Fort</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Delphine</namePart>
<namePart type="family">Bernhard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lucie</namePart>
<namePart type="family">Steiblé</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2017-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 - Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Iris</namePart>
<namePart type="family">Eshkol-Taravella</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jean-Yves</namePart>
<namePart type="family">Antoine</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Orléans, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous présentons ici les résultats d‘une expérience menée sur l‘annotation en parties du discours d‘un corpus d‘une langue régionale encore peu dotée, l‘alsacien, via une plateforme de myriadisation (crowdsourcing) bénévole développée spécifiquement à cette fin : Bisame1 . La plateforme, mise en ligne en mai 2016, nous a permis de recueillir 15 846 annotations grâce à 42 participants. L’évaluation des annotations, réalisée sur un corpus de référence, montre que la F-mesure des annotations volontaires est de 0, 93. Le tagger entraîné sur le corpus annoté atteint lui 82 % d‘exactitude. Il s‘agit du premier tagger spécifique à l‘alsacien. Cette méthode de développement de ressources langagières est donc efficace et prometteuse pour certaines langues peu dotées, dont un nombre suffisant de locuteurs est connecté et actif sur le Web. Le code de la plateforme, le corpus annoté et le tagger sont librement disponibles.</abstract>
<identifier type="citekey">millour-etal-2017-vers</identifier>
<location>
<url>https://aclanthology.org/2017.jeptalnrecital-long.10/</url>
</location>
<part>
<date>2017-6</date>
<extent unit="page">
<start>139</start>
<end>154</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Vers une solution légère de production de données pour le TAL : création d‘un tagger de l‘alsacien par crowdsourcing bénévole (Toward a lightweight solution to the language resources bottleneck issue: creating a POS tagger for Alsatian using voluntary crowdsourcing)
%A Millour, Alice
%A Fort, Karën
%A Bernhard, Delphine
%A Steiblé, Lucie
%Y Eshkol-Taravella, Iris
%Y Antoine, Jean-Yves
%S Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 - Articles longs
%D 2017
%8 June
%I ATALA
%C Orléans, France
%G fra
%F millour-etal-2017-vers
%X Nous présentons ici les résultats d‘une expérience menée sur l‘annotation en parties du discours d‘un corpus d‘une langue régionale encore peu dotée, l‘alsacien, via une plateforme de myriadisation (crowdsourcing) bénévole développée spécifiquement à cette fin : Bisame1 . La plateforme, mise en ligne en mai 2016, nous a permis de recueillir 15 846 annotations grâce à 42 participants. L’évaluation des annotations, réalisée sur un corpus de référence, montre que la F-mesure des annotations volontaires est de 0, 93. Le tagger entraîné sur le corpus annoté atteint lui 82 % d‘exactitude. Il s‘agit du premier tagger spécifique à l‘alsacien. Cette méthode de développement de ressources langagières est donc efficace et prometteuse pour certaines langues peu dotées, dont un nombre suffisant de locuteurs est connecté et actif sur le Web. Le code de la plateforme, le corpus annoté et le tagger sont librement disponibles.
%U https://aclanthology.org/2017.jeptalnrecital-long.10/
%P 139-154
Markdown (Informal)
[Vers une solution légère de production de données pour le TAL : création d’un tagger de l’alsacien par crowdsourcing bénévole (Toward a lightweight solution to the language resources bottleneck issue: creating a POS tagger for Alsatian using voluntary crowdsourcing)](https://aclanthology.org/2017.jeptalnrecital-long.10/) (Millour et al., JEP/TALN/RECITAL 2017)
ACL