ISBN-13: 9783639526622 / Francuski / Miękka / 2016 / 136 str.
ISBN-13: 9783639526622 / Francuski / Miękka / 2016 / 136 str.
Ce travail s'intA]gre dans le cadre des systA]mes de dialogue oral Homme-machine et s'intA(c)resse au problA]me de la comprA(c)hension littA(c)rale de la parole en dialecte tunisien dans un domaine restreint. Dans cet ouvrage, nous proposons une mA(c)thode hybride pour la comprA(c)hension littA(c)rale qui consiste A combiner les modA]les CRF et l'ontologie de domaine. Les modA]les CRF tiennent compte des dA(c)pendances locales entre les mots d'un mAame A(c)noncA(c), et l'ontologie permet d'intA(c)grer les connaissances a priori du domaine. Afin d'A(c)valuer la mA(c)thode proposA(c)e, le corpus TuDiCoI du dialogue oral en dialecte tunisien a A(c)tA(c) A(c)laborA(c). Ce corpus constitue un apport intA(c)ressant pour les travaux qui opA]rent particuliA]rement sur le traitement automatique du dialecte tunisien. Ainsi, un guide constituA(c) d'un ensemble de rA]gles orthographiques est proposA(c) afin d'harmoniser les transcriptions. Ce corpus a A(c)tA(c) exploitA(c) pour la construction de l'ontologie de domaine en se basant sur un processus semi-automatique. Les rA(c)sultats d'A(c)valuation montrent que la mA(c)thode hybride proposA(c)e pour la comprA(c)hension est prometteuse et elle peut Aatre exploitA(c)e pour les langues peu dotA(c)es telles que le dialecte tunisien.
Ce travail s'intègre dans le cadre des systèmes de dialogue oral Homme-machine et s'intéresse au problème de la compréhension littérale de la parole en dialecte tunisien dans un domaine restreint. Dans cet ouvrage, nous proposons une méthode hybride pour la compréhension littérale qui consiste à combiner les modèles CRF et l'ontologie de domaine. Les modèles CRF tiennent compte des dépendances locales entre les mots d'un même énoncé, et l'ontologie permet d'intégrer les connaissances a priori du domaine. Afin d'évaluer la méthode proposée, le corpus TuDiCoI du dialogue oral en dialecte tunisien a été élaboré. Ce corpus constitue un apport intéressant pour les travaux qui opèrent particulièrement sur le traitement automatique du dialecte tunisien. Ainsi, un guide constitué d'un ensemble de règles orthographiques est proposé afin d'harmoniser les transcriptions. Ce corpus a été exploité pour la construction de l'ontologie de domaine en se basant sur un processus semi-automatique. Les résultats d'évaluation montrent que la méthode hybride proposée pour la compréhension est prometteuse et elle peut être exploitée pour les langues peu dotées telles que le dialecte tunisien.