Ĝeneralaj informoj
Nacilingva titolo: | Natural Language Processing for Hungarian Speech Synthesis |
Resumo: | Naturlingva prilaboro en la hungara parolsintezo
La ĉeesto de komputiloj kaj interreto en la ĉiutaga vivo de homoj ĉe amuziĝo kaj konkretaj taskoj de informretrovo tra lernado ĝis la helpo al malavantaĝuloj postulas naturan komunikadon kun komputilo inkluzive parolkapablon. Konvena prozodio faciligas la komprenon, pro tio natureco estas postulo ankaǔ por sintezita parolo.
Perhelpe de parolkorpusoj eblas produkti sufiĉe naturajn, sed limigitajn mesaĝojn. Konteksto–parolo transformaj sistemoj havas aliron ankaǔ al eksterlingvaj fontoj. Teksto–parolo transformaj sistemoj (TtS: text-to-speech), kie la fomo kaj enhavo de la teksto ne estas limigitaj kaj tiel antaǔvideblaj, nepre bezonas lingvistikan analizon por produkti bonan prozodion. La trarigardo de naturlingva prilaboro (NLP: Natural Language Processing) en parolsintezo ilustras, kie la lingvoprilaboro rolas gravan rolon: ekde la transformo de specialaj signoj aperantaj en ordinaraj tekstoj al vortoj tra la unusencigo de elparolo sur segmenta nivelo (dank’al morfologia analizo) ĝis la determino de prozodio (dank’al sintaksa analizo). Kvankam la problemoj kaj iliaj solvoj diferencas de lingvoj al lingvoj, lingvosendependaj programoj povas plenumi la taskojn.
La hungara lingvo havas riĉan aglutinan morfologion, kiu disponigas bazon por la sintaksa analizo kaj la fokuso estas sintakse fiksita. La esploroj de la pasintaj du jardekoj (ĉefe tiuj de Katalin É. Kiss) multon malkovris pri la hungara frazstrukturo. Tiu ĉi disertaĵo celas determini rilatojn inter sintakso kaj prozodio, kaj tiel ellabori interfacon sintakso–prozodio, t.e. ellabori algoritmojn, kiuj elformas la prozodion de sintezita parolo. La analizo baziĝas sur bone formitaj frazoj (kiaj troviĝas en neǔtralaj informivaj tekstoj) kaj sur la norma hungara elparolo (kiun respegulas la laǔtlegitaj informoj kaj instrukcioj).
La priskribo de la hungara lingvo okazis enkadre de dependosintakso, ĉar la aǔtoro de la disertaĵo estas konvinkita, ke ĝi rezultigas pli adekvatan kaj simplan priskribon de la hungara lingvo, kiu havas relative liberan vortordon, sed ŝi prikonsideris ankaǔ la signifajn rezultojn de la reganta generativa–strukturalisma aliro. La supra priskribo estas la bazo de limigita sintaksa analizo (parsado), kies tasko estas identigi la strukture kaj funkcie gravajn frazkonstituantojn. La provo determini la strukturon topiko–fokuso rolas gravan rolon.
La komputila analizo de homa parolo estis elektita kiel metodo por ellabori la hungaran modelon de interfaco sintakso-prozodio. La aǔtoro kunmetis specialan frazaron (Anekso), kiun laǔtlegis spertita parolisto, kaj kiu poste estis analizata per la evoluiga sistemo de la hungara parolsintezilo Profivox. Prozodiaj ecoj estis kalkulitaj kaj komparitaj kun teoriaj rezultoj, se ili ekzistis. Surbaze de la konfirmitaj korelacioj inter frazstrukturo kaj prozodio ŝi formulis regulojn kaj testis tiujn per sintezo simulinte la rezultojn de la sintaksa analizo por la frazaro kaj aliaj testofrazoj, fine okazis ankaǔ aǔskulta testado. La eksperimentoj konfirmis rilatojn inter la frazstrukturo kaj prozodio.
La starigitaj reguloj kapablas determini sintagmolimojn, kie la intonacio povas ŝanĝiĝi kaj paǔzo povas okazi, krome distribui la akcentojn.
Trinivela intonacia modelo estis ellaborata por la hungara lingvo, kie la intonacio de frazo (eldiro) kunmetiĝas el (1) la baza melodio de eldiro, (2) la melodio de konsistigaj partoj de la frazo (tone groups – determinataj de la frazostrukturo) kaj el (3) vortakcentoj inklude la fokusakcenton (Koutny–Olaszy–Olaszi 2000).
La disertaĵo prezentas la prozodion de diversaj fraztipoj en la trinivela modelo kaj komparas ilin al la naturaj elparoloj. La rolo de la lasta sintagmo de la frazo en elparolo estas bone konata, sed la rolo de la interna strukturo nur nun ricevis klaran priskribon. Ankaǔ la alĝustiĝo de la elparolo de topiko al tiu de la komento estis ekzamenata (en neǔtralaj frazoj falanta kaj en emfazitaj frazoj leviĝanta). Tiu ĉi regulbaza modelo kapablas priskribi adekvate grandan parton de eldiroj.
Komenciĝis esploro ankaǔ en la direkto de tesktoanalizo. Tio kompletigas la frazanalizon, en kelkaj kazoj povas modifi la fraznivelan prozodion (disponigas aldonajn bazojn por trovi la fokuson), tiel la signifo de frazo estas pli klare interpretebla.
En la lasta parto du specialaj aplikoj de parolsintezo estas prezentataj: komputile asistata lingvoinstruado kaj la Bliss-sistemo destinita helpi la pluroble malavantaĝulojn. La aǔtoro proponas limigitan lingvomodelon por Blissvox, la hungare parolanta versio de Bliss.
La temo ankoraǔ postulas pluan espolon kaj en la tereno de frazstrukturo kaj de tekstostrukturo, plilarĝigon de la valentovortaro kaj inkludon de semantika prilaboro. |
Aŭtoro: | KOUTNY, Ilona |
Lingvo(j): |
angla |
Traduko de la titolo: | Naturlingva prilaboro en la hungara parolsintezo |
Klasifiko: |
Informadiko kaj Esperanto |
Jaro: | 2009 |
Amplekso: | 200 paĝoj |
Prezento-loko: |
Tipo | universitato |
Nomo | Adam Mickiewicz Universitato (UAM) |
Sekcio | Moderna Filologio |
Lando | Pollando |
Adreso | al. Niepodleglosci 4,
PL-61-874 Poznan |
Retejo | ligilo |
|
Tem-gvidanto(j): | Recenzantoj: prof. Elżbieta Artowicz; prof. Geza Gordos; prof. Maciej Karpiński |
Precizigo: | habilitiga, duagrada doktoriga |
Loko de publikigo: | Pollando, Poznan 2008 |
Kontakteblo kun la verkinto: | ikoutny@amu.edu.pl |
Fonto de la informo: | Ilona Koutny |
Ŝlosilvortoj: | hungara sonsistemo, prozodio, sintaksa analizo, dependogramatiko, parolsintezo, lingvogenero, tekstostrukturo, BLISS-sistemo, komputila lingvoinstruado |
Kreodato: | 2010-10-10 18:39:07 |
Lasta redakto: | 2020-02-21 15:38:57 |
Aldoninto: | Ilona Koutny |
Montroj: | 41693 |
Dosieroj: |
Elŝutoj de ĉiuj dosieroj sume: 35; Viaj elŝutoj: 0
(Resumo)
Naturlingva prilaboro en la hungara parolsintezo
.doc
Elŝutoj sume: 35
Kreodato: 2010-10-10 19:30:09
|
Resumo
Naturlingva prilaboro en la hungara parolsintezo
La ĉeesto de komputiloj kaj interreto en la ĉiutaga vivo de homoj ĉe amuziĝo kaj konkretaj taskoj de informretrovo tra lernado ĝis la helpo al malavantaĝuloj postulas naturan komunikadon kun komputilo inkluzive parolkapablon. Konvena prozodio faciligas la komprenon, pro tio natureco estas postulo ankaǔ por sintezita parolo.
Perhelpe de parolkorpusoj eblas produkti sufiĉe naturajn, sed limigitajn mesaĝojn. Konteksto–parolo transformaj sistemoj havas aliron ankaǔ al eksterlingvaj fontoj. Teksto–parolo transformaj sistemoj (TtS: text-to-speech), kie la fomo kaj enhavo de la teksto ne estas limigitaj kaj tiel antaǔvideblaj, nepre bezonas lingvistikan analizon por produkti bonan prozodion. La trarigardo de naturlingva prilaboro (NLP: Natural Language Processing) en parolsintezo ilustras, kie la lingvoprilaboro rolas gravan rolon: ekde la transformo de specialaj signoj aperantaj en ordinaraj tekstoj al vortoj tra la unusencigo de elparolo sur segmenta nivelo (dank’al morfologia analizo) ĝis la determino de prozodio (dank’al sintaksa analizo). Kvankam la problemoj kaj iliaj solvoj diferencas de lingvoj al lingvoj, lingvosendependaj programoj povas plenumi la taskojn.
La hungara lingvo havas riĉan aglutinan morfologion, kiu disponigas bazon por la sintaksa analizo kaj la fokuso estas sintakse fiksita. La esploroj de la pasintaj du jardekoj (ĉefe tiuj de Katalin É. Kiss) multon malkovris pri la hungara frazstrukturo. Tiu ĉi disertaĵo celas determini rilatojn inter sintakso kaj prozodio, kaj tiel ellabori interfacon sintakso–prozodio, t.e. ellabori algoritmojn, kiuj elformas la prozodion de sintezita parolo. La analizo baziĝas sur bone formitaj frazoj (kiaj troviĝas en neǔtralaj informivaj tekstoj) kaj sur la norma hungara elparolo (kiun respegulas la laǔtlegitaj informoj kaj instrukcioj).
La priskribo de la hungara lingvo okazis enkadre de dependosintakso, ĉar la aǔtoro de la disertaĵo estas konvinkita, ke ĝi rezultigas pli adekvatan kaj simplan priskribon de la hungara lingvo, kiu havas relative liberan vortordon, sed ŝi prikonsideris ankaǔ la signifajn rezultojn de la reganta generativa–strukturalisma aliro. La supra priskribo estas la bazo de limigita sintaksa analizo (parsado), kies tasko estas identigi la strukture kaj funkcie gravajn frazkonstituantojn. La provo determini la strukturon topiko–fokuso rolas gravan rolon.
La komputila analizo de homa parolo estis elektita kiel metodo por ellabori la hungaran modelon de interfaco sintakso-prozodio. La aǔtoro kunmetis specialan frazaron (Anekso), kiun laǔtlegis spertita parolisto, kaj kiu poste estis analizata per la evoluiga sistemo de la hungara parolsintezilo Profivox. Prozodiaj ecoj estis kalkulitaj kaj komparitaj kun teoriaj rezultoj, se ili ekzistis. Surbaze de la konfirmitaj korelacioj inter frazstrukturo kaj prozodio ŝi formulis regulojn kaj testis tiujn per sintezo simulinte la rezultojn de la sintaksa analizo por la frazaro kaj aliaj testofrazoj, fine okazis ankaǔ aǔskulta testado. La eksperimentoj konfirmis rilatojn inter la frazstrukturo kaj prozodio.
La starigitaj reguloj kapablas determini sintagmolimojn, kie la intonacio povas ŝanĝiĝi kaj paǔzo povas okazi, krome distribui la akcentojn.
Trinivela intonacia modelo estis ellaborata por la hungara lingvo, kie la intonacio de frazo (eldiro) kunmetiĝas el (1) la baza melodio de eldiro, (2) la melodio de konsistigaj partoj de la frazo (tone groups – determinataj de la frazostrukturo) kaj el (3) vortakcentoj inklude la fokusakcenton (Koutny–Olaszy–Olaszi 2000).
La disertaĵo prezentas la prozodion de diversaj fraztipoj en la trinivela modelo kaj komparas ilin al la naturaj elparoloj. La rolo de la lasta sintagmo de la frazo en elparolo estas bone konata, sed la rolo de la interna strukturo nur nun ricevis klaran priskribon. Ankaǔ la alĝustiĝo de la elparolo de topiko al tiu de la komento estis ekzamenata (en neǔtralaj frazoj falanta kaj en emfazitaj frazoj leviĝanta). Tiu ĉi regulbaza modelo kapablas priskribi adekvate grandan parton de eldiroj.
Komenciĝis esploro ankaǔ en la direkto de tesktoanalizo. Tio kompletigas la frazanalizon, en kelkaj kazoj povas modifi la fraznivelan prozodion (disponigas aldonajn bazojn por trovi la fokuson), tiel la signifo de frazo estas pli klare interpretebla.
En la lasta parto du specialaj aplikoj de parolsintezo estas prezentataj: komputile asistata lingvoinstruado kaj la Bliss-sistemo destinita helpi la pluroble malavantaĝulojn. La aǔtoro proponas limigitan lingvomodelon por Blissvox, la hungare parolanta versio de Bliss.
La temo ankoraǔ postulas pluan espolon kaj en la tereno de frazstrukturo kaj de tekstostrukturo, plilarĝigon de la valentovortaro kaj inkludon de semantika prilaboro.
|
|