Katalogo

Al la komenco

Titolo:Frequency Dictionary Esperanto - Oftecvortaro de Esperanto
Aŭtoro(j): FIEDLER, Sabine
QUASTHOFF, Uwe
HALLSTEINSDÓTTIR, Erla (red.)
Eldonejo:Leipziger Universitätsverlag 2014
ISBN:978-3-86583-880-3
Akireblo:aĉetebla
Tipo(j):kd-rom
Nivelo:B1, B2, C1, C2
Celgrupo:nacilingva
Aĝgrupo:pluraj aĝoj
Aĉeteblo:
Nia opinio:Esperanto
La serio Frequency Dictionaries havas la celon disponigi vortarojn kun kompareblaj oftec-informoj por granda nombro da lingvoj. Per enigo al tiu ĉi serio, por multaj lingvoj la unuan fojon ekestas ŝancoj por posedi oftec-vortarojn, kiuj uzas vastan empirian bazon.
La almetita KD enhavas pli ampleksan version de la vortaro forme de elektronika libro kun datumoj pri relativa ofteco de ĝis unu miliono da vortformoj. Por kelkaj lingvoj la listoj estas pli mallongaj pro la reduktita amplekso de la korpusoj. La Esperanta vortlisto por tiu ĉi volumo enhavas 250000 alfabete ordigitajn vortformojn. La vortlisto kun oftec-klasoj estas ankaŭ havebla kiel pure teksta dosiero je la KD kaj ordigita laŭ alfabeto kaj laŭ ofteco. El tio facile genereblas listoj por diversaj aplikoj. La vortformoj en la presita vortaro estis zorge kontrolitaj permane por trovi kaj marki erarajn formojn. Diference de tio, la ampleksa listo je la KD estis kontrolita nur per aŭtomataj kredeblecaj kriterioj.
Por la kompilado estis prilaboritaj ampleksaj elektronike riceveblaj fontoj de la Leipzig Corpora Collection laŭ unuecaj metodoj. La korpusoj, sur kiuj la oftec-vortaroj baziĝas, konsistas el gazetaraj tekstoj, artikoloj de Vikipedio kaj aliaj hazarde kolektitaj retaj tekstoj. Ili estas alireblaj ĉe http://corpora.informatik.uni-leipzig.de/. Tiu ĉi serio de vortaroj ne nur donas la eblecon studi diversajn aspektojn de vortfarado aŭ de oftec-dependa difinado de leksikaj terenoj por vortaroj kaj fremdlingva instruado rilate al koncerna lingvo, sed ankaŭ ebligas trakti lingvokomparajn demandojn. La statistikaj rezultoj prezentitaj ĉi tie donas unuan impulson al tiuj esploroj.
La titoloj de la oftec-vortaroj ĉiam inkluzivas la nomon de la lingvo en la angla, en la koncerna lingvo mem kaj ankaŭ la triliteran mallongigon laŭ ISO 639-3.

Mendeblo en Germanio: http://univerlag-leipzig.de/catalog/article/1593-Frequency_Dictionary_Esperanto
Sabine Fiedler prezentis sian laboron en septembro 2014 dum la interlingvistika Simpozio en Poznan. La prelegon Katalin Kovats sonregistris.
La sonmaterialon vi povas trovi en nia Ipernity-paĝo.
Dum la prelego Sabine Fiedler projekciis kelkajn bildojn, tabelojn, ilin vi povas vidi en la PDF-dokumento. Ni atentigas vin, ke ĝi estas komprenebla nur se vi ankaŭ aŭskultas la prelegon.
Dankon al Sabine pro la librodonaco.

English
The series Frequency Dictionaries aims at producing dictionaries with comparable frequency data for a large number of different languages. For many of the languages featured in this collection, this series is the first comprehensive compilation using a large-scale empirical base.
The dictionaries are available in print and electronic version. Each dictionary provides the most frequent 1000 word forms ordered by frequency and the most frequent 10000 word forms in alphabetical order. They provide an introductory description of the data and the methodological approach. In addition, language specific statistical information on letters, word structure and structural changes depending on word frequency is provided. The enclosed CD-ROM contains a more comprehensive version of the dictionary as an e-book, with data on relative frequency of up to 1000000 word forms given in alphabetical order.
This series of dictionaries provides the opportunity to explore comparative linguistic topics as well as monolingual issues such as studies on word formation and frequency-based examinations of lexical areas for dictionaries or language teaching.
Kreodato:2015-01-04 12:47:28
Lasta redakto:2015-01-06 14:56:37
Montroj:18292
Dosieroj: Mankas dosieroj.

Strukturo

Enkonduko: estas
Enhavo: Contents
1 Word forms and their frequencies 1
1.1 Previous frequency lists and dictionaries for Esperanto . . . 1
1.2 Structure of entries and frequency data . . . . . . . . …… . . . 2
1.3 Data in electronic form . . . . . . . . . . . . . . . . . …………… . . 4
1.4 Conception of a dictionary of word forms . . . . . . .. . . . . . . . 4
1.5 On the definition of a word . . . . . . . . . . . . .. . . . .. . . . . . .. . 6
1.6 Productivity and writing variants . . . . . . .. . . . . . . . .. . . . .. . 7
2 Corpus 13
2.1 Data basis and extent of data collection . . . . . .. . . . . . . . . 13
2.2 Corpus timeline . . . . . . . . . . . . . . . . . . . . . .. . . . .. . . . .. . . 14
2.3 Data pre-processing . . . . . . . . . . . . . . . . .. . . . .. . . . . . . . . 14
Statistical data on the word list.. . .. . . . .. . . . .. . . . .. . . . .. . . . .17
3.1 Comparison criteria . . . . . . . . .. . . . .. . . .. . . . . . . . . . . . . . 17
3.2 Character statistics . . . . . . . . . . . .. . . . .. . . . . . . . . . . . . . 18
3.3 Vowels and consonants . . . . . . . . . . .. . .. . . . . . . . . . . . . . 18
3.4 Word length . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . 21
3.5 Word structure . . . . . . . . . . . . . . . . . . . .. . . . .. . . . . . . . . . 22
3.6 Zipf 's law . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . .. . 24
3.7 Text coverage of the top-N most frequent words. . . . .. . . . 25
3.8 Growth in word length . . . . . . . . . . . . . . . . . . . . . .. . . . .. . . 25
3.9 Number of syllables . . . . . . . . . . . . . . . . .. . . . .. . . . . . . . . 29
3.10 Number of letter bigrams and trigrams . . . . . . . .. . . . . . .. 30
3.11 Summary of statistical data . . . . . . . . . . . . . . . . .. . . . .. . . 31
4 References . . . . .. . . . .. . . . .. .. . .. . . . .. . . . .. . . . .. . . . .. . . .33
5 Most frequent words ordered by rank . . . . .. . . . .. . . . .. . . . ..35
6 Alphabetical frequency list . . . . .. . . . .. . . . .. . . . .. . . . .. . . . ..47

Ekstera formato

Mezuro: 14 x 22 cm
Paĝnombro: 116
Koloreco: nigra-blanka
Ilustraĵoj: neniu
Legebleco: bona
Kunligmaniero: bindita
Ĝenerala aspekto: alloga

Opinioj kaj komentoj

Entute komentoj: 1; Mezuma noto: 0; | Aldoni propran opinion

1.
Bernadox je 2015-04-16 04:08:02

Tre zorge kaj fidinde farita laboraĵo. La Lepsika Korpuso fariĝu ĉiutaga laboraĵo de ĉiu serioza esperantisto progresinta.

Kopirajto © 2001 - 2017 edukado.net. Ĉiuj rajtoj rezervitaj.
Funkciigita de Fondaĵo Edukado.net kunlabore kun E-dukati, ESF kaj E@I.

Programado kaj aspektigo
de Studio GAUS.