ISO 639-3 - ISO 639-3

Z Wikipédie, Voľnej Encyklopédie

Pin
Send
Share
Send

ISO 639-3: 2007, Kódy na zastúpenie názvov jazykov - Časť 3: Alfa-3 kód na komplexné pokrytie jazykov, je medzinárodný štandard pre jazykové kódy v ISO 639 série. Definuje trojpísmenové kódy na identifikáciu jazykov. Normu vydal Medzinárodná organizácia pre štandardizáciu (ISO) 1. februára 2007.[1]

ISO 639-3 rozširuje ISO 639-2 alfa-3 kódy s cieľom pokryť všetky známe prirodzené jazyky. Rozšírené jazykové pokrytie bolo založené predovšetkým na jazykových kódoch používaných v EÚ Etnológ (zväzky 10 - 14), vydané SIL International, ktorá je teraz registračný orgán pre ISO 639-3.[2] Poskytuje výčet jazykov čo najkompletnejších, vrátane živých a zaniknutých, starodávnych a zostrojených, hlavných a vedľajších, písaných i nepísaných.[1] Nezahŕňa to však rekonštruované jazyky ako napr Protoindoeurópske.[3]

ISO 639-3 je určená na použitie ako metadáta kódy v širokej škále aplikácií. Je široko používaný v počítačových a informačných systémoch, ako je napríklad internet, v ktorých je potrebné podporovať veľa jazykov. V archívoch a iných úložiskách informácií sa používa v katalogizačných systémoch, čo naznačuje, v akom jazyku alebo v akom prostriedku sa zdroj nachádza. Kódy sa tiež často používajú v lingvistickej literatúre a inde na kompenzáciu skutočnosti, že názvy jazykov môžu byť nejasné alebo nejednoznačné.

Nájdite jazyk
Zadajte kód ISO 639-3, aby ste našli zodpovedajúci článok v jazyku.

Kódy jazykov

ISO 639-3 zahŕňa všetky jazyky v ISO 639-1 a všetky jednotlivé jazyky v jazyku ISO 639-2. ISO 639-1 a ISO 639-2 sa zameriavajú na hlavné jazyky, najčastejšie zastúpené v celom rozsahu svetovej literatúry. Pretože ISO 639-2 obsahuje aj jazykové zbierky a časť 3 nie, ISO 639-3 nie je nadmnožinou ISO 639-2. Kde B a T kódy existujú v ISO 639-2, ISO 639-3 používa T-kódy.

Príklady jazykových kódov ISO
Jazyk639-1639-2 (B / T)639-3 typ639-3 kód
Angličtinaenanglindividuálneangl
Nemeckydeger / deuindividuálnedeu
Arabskyararamakroara
individuálnearb + ďalšie
Čínštinazhchi / zho[4][5]makrozho
Mandarínkaindividuálnecmn
kantónskyindividuálneyue
Minnanindividuálnenan

K 30. januáru 2020, norma obsahuje 7 868 záznamov.[6] Zoznam jazykov je založený na niekoľkých zdrojoch, medzi ktoré patria: jednotlivé jazyky obsiahnuté v 639-2, moderné jazyky z Etnológ, historické odrody, starodávne jazyky a umelé jazyky z Zoznam lingvistov,[7] ako aj jazyky odporúčané v rámci ročného obdobia pre verejné pripomienkovanie.

Strojovo čitateľné údaje súbory poskytuje registračný úrad.[6] Pomocou týchto dátových súborov je možné vykonať mapovanie z ISO 639-1 alebo ISO 639-2 na ISO 639-3.

Účelom normy ISO 639-3 je predpokladať rozlišovanie na základe kritérií, ktoré nie sú úplne subjektívne.[8] Účelom tohto dokumentu nie je zdokumentovať alebo poskytnúť identifikátory pre dialekty alebo iné jazykové varianty.[9] Napriek tomu môžu byť rozsudky týkajúce sa rozdielov medzi jazykmi subjektívne, najmä v prípade jazykových variet bez zavedených literárnych tradícií, používania vo vzdelávaní alebo v médiách alebo iných faktorov, ktoré prispievajú k jazykovej konvenčnosti. Norma by sa preto nemala považovať za smerodajné vyhlásenie o tom, aké odlišné jazyky vo svete existujú (o čom v niektorých prípadoch môže dôjsť k podstatným nezhodám), ale iba za jednoduchý spôsob presnej identifikácie rôznych jazykových variet.

Kódový priestor

Pretože je kód trojpísmenový, abecedný, horná hranica počtu jazykov, ktoré je možné reprezentovať, je 26 × 26 × 26 = 17 576. Pretože ISO 639-2 definuje špeciálne kódy (4), vyhradený rozsah (520) a kódy iba pre B (22), nemožno v časti 3 použiť 546 kódov. Prísnejšia horná hranica je preto 17 576 - 546 = 17 030.

Horná hranica je ešte prísnejšia, ak sa odpočítajú jazykové kolekcie definované v 639-2 a tie, ktoré ešte nebudú definované ISO 639-5.

Makrojazyky

Existuje 58 jazykov v ISO 639-2, ktoré sa na účely tejto normy považujú za „makrojazyky“ v ISO 639-3.[10]

Niektoré z nich makrojazyky nemal žiadny individuálny jazyk, ako je definovaný v ISO 639-3 v kódovej sade ISO 639-2, napr. „ara“ (všeobecná arabčina). Iní ako „nor“ (nórsky) mali svoje dve samostatné časti („nno“ (Nynorsk), „nob“ (Bokmål)) už v ISO 639-2.

To znamená, že niektoré jazyky (napr. „Arb“, štandardná arabčina), ktoré ISO 639-2 považovala za dialekty jedného jazyka („ara“), sú teraz v ISO 639-3 v určitých kontextoch považované za samotné jazyky.

Jedná sa o pokus zaoberať sa odrodami, ktoré sa môžu navzájom jazykovo odlišovať, ale ich hovorcovia s nimi zaobchádzajú ako s dvoma formami toho istého jazyka, napr. v prípadoch diglosia.

Napríklad:

Pozri[11] pre kompletný zoznam.

Kolektívne jazyky

„Prvkom kódu spoločného jazyka je identifikátor, ktorý predstavuje skupinu jednotlivých jazykov, ktoré sa v žiadnom kontexte používania nepovažujú za jeden jazyk.“[12] Tieto kódy nereprezentujú presne konkrétny jazyk alebo makrojazyk.

Zatiaľ čo ISO 639-2 obsahuje trojpísmenové identifikátory pre kolektívne jazyky, tieto kódy sú z ISO 639-3 vylúčené. ISO 639-3 preto nie je nadmnožinou normy ISO 639-2.

ISO 639-5 definuje trojpísmenové kolektívne kódy pre jazykové rodiny a skupiny vrátane kódov kolektívnych jazykov z ISO 639-2.

Špeciálne kódy

V roku sú vyčlenené štyri kódy ISO 639-2 a ISO 639-3 pre prípady, keď nie je vhodný žiadny zo špecifických kódov. Sú určené predovšetkým pre aplikácie, ako sú databázy, kde sa vyžaduje kód ISO bez ohľadu na to, či taký existuje.

  • mis (nekódované jazyky, pôvodne skratka pre „miscellaneous“) je určená pre jazyky, ktoré (zatiaľ) neboli zahrnuté v norme ISO.
  • mul (viac jazykov) je určený pre prípady, keď údaje obsahujú viac ako jeden jazyk a (napríklad) databáza vyžaduje jeden kód ISO.
  • und (neurčené) je určené pre prípady, keď jazyk v údajoch nebol identifikovaný, napríklad keď je nesprávne označený alebo nikdy nebol označený. Nie je určený pre prípady ako napr Trójsky kôň kde bol názov bezoverovaného jazyka.
  • zxx (žiadny jazykový obsah / neuplatňuje sa) je určený pre údaje, ktoré vôbec nie sú jazykom, napríklad hovory so zvieratami.[13]

Okrem toho v rozsahu 520 kódov qaaqtz sú „vyhradené pre miestne použitie“. Napríklad Zoznam lingvistov používa ich na vyhynuté jazyky. Zoznam lingvistov priradil jednému z nich všeobecnú hodnotu: qnp, nemenovaný proto-jazyk. Používa sa pre navrhované medziľahlé uzly v rodokmeni, ktoré nemajú meno.

Procesy údržby

Tabuľka kódov pre ISO 639-3 je otvorená zmenám. Z dôvodu ochrany stability súčasného používania sú povolené zmeny obmedzené na:[14]

  • úpravy referenčných informácií k záznamu (vrátane mien alebo kategorizácií pre typ a rozsah),
  • pridanie nových záznamov,
  • ukončenie podpory položiek, ktoré sú duplikáty alebo falošné,
  • - zlúčenie jedného alebo viacerých záznamov do iného záznamu a -
  • rozdelenie záznamu v existujúcom jazyku na niekoľko záznamov v novom jazyku.

Kód pridelený jazyku sa nezmení, pokiaľ nedôjde aj k zmene denotátu.[15]

Zmeny sa vykonávajú v ročnom cykle. Každá žiadosť má minimálne tri mesiace na verejné preskúmanie.

Webová stránka ISO 639-3 má stránky, ktoré popisujú „rozsah denotácie“[16] (malátny typy) a typy jazykov,[17] ktoré vysvetľujú, aké koncepty sú v rozsahu pre kódovanie a určité kritériá, ktoré je potrebné splniť. Napríklad konštruované jazyky môžu byť kódované, ale iba ak sú určené na ľudskú komunikáciu a obsahujú množstvo literatúry, ktorá zabraňuje požiadavkám na idiosynkratické vynálezy.

Pokyny registračného orgánu na jeho webovej stránke uvedené v texte normy ISO 639-3 týkajúce sa spôsobu údržby tabuľkových kódov.[18] Tiež dokumentuje procesy použité na príjem a spracovanie požiadaviek na zmeny.[19]

Poskytuje sa formulár žiadosti o zmenu a existuje druhý formulár na zhromažďovanie informácií o navrhovaných dodatkoch. Žiadosť o zmenu môže podať ktorákoľvek strana. Po odoslaní žiadosti najskôr skontroluje úplnosť registračného orgánu.

Keď sa prijme úplne zdokumentovaná žiadosť, pridá sa do zverejneného indexu požiadaviek na zmeny. Oznámenia sa zasielajú aj do všeobecného diskusného zoznamu LINGUISTOV v zozname lingvistov a ďalších zoznamoch, ktoré registračný úrad môže považovať za relevantné, a vyzývajú tak na verejné preskúmanie a vstup k požadovanej zmene. Každý vlastník alebo jednotlivec zoznamu je schopný požiadať o upozornenie na žiadosti o zmenu pre konkrétne regióny alebo jazykové rodiny. Prijaté komentáre sú zverejnené pre ďalšie strany na kontrolu. Na základe konsenzu v prijatých pripomienkach môže byť žiadosť o zmenu stiahnutá alebo povýšená na „štatút kandidáta“.

Tri mesiace pred koncom ročného kontrolného cyklu (zvyčajne v septembri) sa nastaví oznámenie na diskusný zoznam LINGUISTOV a ďalšie zoznamy týkajúce sa žiadostí o zmenu stavu kandidáta. Všetky žiadosti zostávajú otvorené na preskúmanie a pripomienkovanie až do konca ročného kontrolného cyklu.

Rozhodnutia sa oznamujú na konci ročného kontrolného cyklu (zvyčajne v januári). V tom čase môžu byť žiadosti úplne alebo čiastočne prijaté, zmenené a doplnené a prenesené do ďalšieho cyklu preskúmania alebo zamietnuté. Odmietnutia často zahŕňajú návrhy, ako upraviť návrhy na opätovné predloženie. O každej žiadosti o zmenu sa vedie verejný archív spolu s prijatými rozhodnutiami a ich odôvodnením.[20]

Kritika

Lingvisti Morey, Post a Friedman vznášajú rôzne kritiky normy ISO 639, najmä ISO 639-3:[15]

  • Samotné trojpísmenové kódy sú problematické, pretože aj keď sú oficiálne svojvoľné technické štítky, často sú odvodené od mnemotechnických skratiek pre názvy jazykov, z ktorých niektoré sú pejoratívne. Napríklad, Yemsa bol pridelený kód jnj, z pejoratívneho „Janejero“. Tieto kódy teda môžu byť rodenými hovorcami považované za urážlivé, avšak kódy v štandarde, akonáhle sú pridelené, už nie je možné zmeniť.
  • Správa normy je problematická, pretože SIL je misijná organizácia s nedostatočnou transparentnosťou a zodpovednosťou. Rozhodnutia o tom, čo si zaslúži byť zakódované ako jazyk, sa prijímajú interne. Aj keď vonkajšie vstupy môžu, ale nemusia byť vítané, samotné rozhodnutia sú nepriehľadné a mnoho lingvistov sa vzdalo snahy o zlepšenie štandardu.
  • Trvalá identifikácia jazyka je nezlučiteľná so zmenou jazyka.
  • Jazyky a dialekty často nemožno presne rozlišovať a nárečové kontinua možno rozdeliť mnohými spôsobmi, zatiaľ čo štandardné privilégiá majú jednu voľbu. Takéto rozdiely sú často založené skôr na sociálnych a politických faktoroch.
  • ISO 639-3 môžu byť nesprávne pochopené a zneužité orgánmi, ktoré rozhodujú o identite a jazyku ľudí, čím zrušia právo hovoriacich na identifikáciu alebo identifikáciu s ich jazykovou rozmanitosťou. Aj keď je SIL na tieto problémy citlivý, tento problém je inherentný v povahe zavedeného štandardu, ktorý sa môže použiť (alebo nesprávne použiť) spôsobom, ktorý ISO a SIL nezamýšľajú.

Martin Haspelmath súhlasí so štyrmi z týchto bodov, ale nie s bodom o zmene jazyka.[21] Nesúhlasí, pretože akýkoľvek popis jazyka si vyžaduje jeho identifikáciu, a my tak môžeme ľahko identifikovať rôzne etapy jazyka. Navrhuje, aby lingvisti mohli uprednostniť použitie kodifikácie, ktorá sa robí na malátny úrovni, pretože „jazykovedcom málokedy záleží na tom, či to, o čom hovoria, je jazyk, dialekt alebo úzkoprsá rodina jazykov.“ Tiež sa pýta, či je norma ISO na identifikáciu jazyka vhodná, pretože ISO je priemyselná organizácia, zatiaľ čo jazykovú dokumentáciu a nomenklatúru považuje za vedecké úsilie. Cituje pôvodnú potrebu štandardizovaných jazykových identifikátorov ako „ekonomický význam prekladu a prekladov“ lokalizácia softvéru„„ na tento účel boli stanovené normy ISO 639-1 a 639-2. Vzbudzuje však pochybnosti o potrebe odvetvia komplexného pokrytia poskytovaného normou ISO 639-3, vrátane “málo známych jazykov malých spoločenstiev, ktoré sú sa nikdy nepoužijú písomne ​​alebo len ťažko a často im hrozí vyhynutie “.

Využitie

Referencie

  1. ^ a b „Stav ISO 639-3 a abstrakt“. iso.org. 2010-07-20. Získané 2012-06-14.
  2. ^ „Údržbárske agentúry a registračné orgány“. ISO.
  3. ^ „Typy jednotlivých jazykov - starodávne jazyky“. sil.org. Získané 2018-06-11.
  4. ^ Správa z etnológie pre kód ISO 639: zho Archivované 2014-09-12 na Wayback Machine na stránke ethnologue.com
  5. ^ ISO639-3 na SIL.org
  6. ^ a b „Sada kódov ISO 639-3“. Sil.org. 2007-10-18. Získané 2012-06-14.
  7. ^ „ISO 639-3“. sil.org.
  8. ^ „Rozsah denotácie: jednotlivé jazyky“. sil.org.
  9. ^ „Rozsah denotácie: dialekty“. sil.org.
  10. ^ „Rozsah označenia: Makrojazyky“. sil.org. Získané 2012-06-14.
  11. ^ „Mapovanie makrológov“. sil.org. Získané 2012-06-14.
  12. ^ „Rozsah označenia: kolektívne jazyky“. sil.org. Získané 2012-06-14.
  13. ^ Terénne záznamy hovorov opice červenej. Záznam v katalógu Konzorcium pre lingvistické údaje. Citované 2012-09-04.
  14. ^ „Predkladanie požiadaviek na zmenu ISO 639-3: Typy zmien“. sil.org.
  15. ^ a b Morey, Stephen; Post, Mark W .; Friedman, Victor A. (2013). Jazykové kódy ISO 639: Predčasná, nakoniec nedosiahnuteľná a pravdepodobne škodlivá štandardizácia. Konferencia RRR PARADISEC. Archivované od pôvodné dňa 2016-02-23. Získané 2015-11-03.
  16. ^ „Rozsah označenia jazykových identifikátorov“. sil.org.
  17. ^ „Druhy jazykov“. sil.org.
  18. ^ „ISO 639-3 Správa zmien“. sil.org.
  19. ^ „Odosielanie požiadaviek na zmenu ISO 639-3“. sil.org.
  20. ^ „Register požiadaviek na zmenu ISO 639-3“. sil.org.
  21. ^ Martin Haspelmath, „Je možné jazykovú identitu štandardizovať? Na kritiku ISO 639-3 podľa Moreyho a spol.“, Komentár k jazykovej rozmanitosti, 2013/12/04
  22. ^ „OLAC Language Extension“. language-archives.org. Získané 3. augusta 2015.
  23. ^ „Viac ako 7 000 jazykov, iba 1 Windows“. Microsoft. 05.02.2014.
  24. ^ „Pravidlá pre jazykové návrhy“. wikimedia.org. Získané 3. augusta 2015.
  25. ^ „BCP 47 - Značky na identifikáciu jazykov“. ietf.org. Získané 3. augusta 2015.
  26. ^ a b „Publikácie EPUB 3.0“. idpf.org. Získané 3. augusta 2015.
  27. ^ „Podmienky metadát DCMI“. purl.org. Získané 3. augusta 2015.
  28. ^ „Dvojpísmenové alebo trojpísmenové kódy jazyka ISO“. w3.org. Získané 3. augusta 2015.
  29. ^ "Jazykový register". Iana.org. Získané 2015-08-12.
  30. ^ „3 Sémantika, štruktúra a API dokumentov HTML - HTML5“. w3.org. Získané 3. augusta 2015.
  31. ^ „Prvky - Pokyny pre používateľa MODS: Schéma popisu objektu metadáta: MODS (Library of Congress)“. loc.gov. Získané 3. augusta 2015.
  32. ^ „Jazyk elementov TEI“. tei-c.org. Získané 3. augusta 2015.

Ďalšie čítanie

vonkajšie odkazy

Pin
Send
Share
Send