TEI
La nòrma TEI es un ensemble de preconizacions (TEI Guidelines[1]) qu'especifican de metòdes d'encodatge pels tèxtes que las maquinas pòdon legir, mai que mai en lingüistica e en sciéncias umanas e socialas.
Aquelas preconizacions son redigidas per la TEI (Text encoding initiative[2]), un consòrci que desvolopa e manten d'un biais collectiu de nòrmas per la representacion de tèxtes jos la forma numerica. Es una organizacion a tòca pas lucrativa compausada d'institucions academicas, de còlas de recèrca e d'especialistas individuals del monde tot[3].
Structura del format TEI
[modificar | Modificar lo còdi]Dempuèi la version P4, la TEI es un jos-format del lengatge XML[4]. Aquel utiliza de balisas qu'enquadran un tròç de tèxte e lo qualifican. Aquelas balisas pòdon aver d'atributs, obligatòris o facultatius, que precisan la qualificacion.
Ex. : <pron notation="IPA">trænskrɪpʃən</pron>
La balisa <pron> enquadra lo mot "trænskrɪpʃən", indicant qu'es una prononciacion. L'atribut "notacion", qu'a coma valor "IPA", indica qu'aquela prononciacion es transcriuta en Alfabet Fonetic Internacional.
Las preconizacions
[modificar | Modificar lo còdi]Las TEI Guidelines an agut mantuna version :
- TEI P1 (publicada en 1990)
- TEI P2 (publicada en 1992-1993)
- TEI P3 (publicada en 1994)
- TEI P4 (publicada en 2002)
- TEI P5[5] (publicada en 2007)
La version utilizada uèi es la TEI P5 v2.0.1, publicada en 2011.
Definís un cèrt nombre de balisas adaptadas a l'etiquetatge de tèxtes numerics. Per cada balisa, prepausa d'unes atributs e balha d'exemples de valors que pòdon préner.
Aquelas balisas son amassadas dins de moduls que correspondan a las diferentas utilizacions que se pòdon far de la TEI (poesia, transcripcions de discorses, diccionaris, manuscrits...).
Libertat d'utilizacion
[modificar | Modificar lo còdi]Aquelas Guidelines son publicadas en open source. I podèm accedir en linha[6], ne telecargar una version pdf[7] o ebook[8], ne far una còpia locala... D'efièit, la TEI vòl èstre un format obèrt que cadun pòt adaptar a sos projèctes[9]
Projèctes qu'utilizan la TEI
[modificar | Modificar lo còdi]Numeroses projèctes dins lo monde an causit la TEI per encodar los lors tèxtes. Podèm citar :
- British National Corpus[10]
- Oxford Text Archive[11]
- FreeDict[12]
- Otisses del Congrès Permanent de la Lenga Occitana[13]
- Le Petit Larousse Illustré de 1905[14]
- Base de Français Médiéval – Old French Corpus[15]
- Perseus Project[16]
Nòtas e referéncias
[modificar | Modificar lo còdi]- ↑ http://www.tei-c.org/Guidelines/
- ↑ https://web.archive.org/web/20150612040042/http://www.tei-c.org/index.xml
- ↑ https://web.archive.org/web/20150612040042/http://www.tei-c.org/index.xml
- ↑ http://www.tei-c.org/Vault/P4/
- ↑ http://www.tei-c.org/Guidelines/P5/
- ↑ http://www.tei-c.org/release/doc/tei-p5-doc/en/html/
- ↑ http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf
- ↑ http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.epub
- ↑ http://www.tei-c.org/Guidelines/
- ↑ http://www.natcorp.ox.ac.uk/
- ↑ http://ota.ox.ac.uk/
- ↑ http://freedict.org/
- ↑ https://web.archive.org/web/20161201094506/http://www.locongres.org/oc/lo-congres/tribalhs-deu-congres/formatatge-en-tei
- ↑ http://dictionnaire1905.u-cergy.fr/
- ↑ http://txm.bfm-corpus.org/bfm
- ↑ http://www.perseus.tufts.edu/