TEI

Un article de Wikipèdia, l'enciclopèdia liura.

La nòrma TEI es un ensemble de preconizacions (TEI Guidelines[1]) qu'especifican de metòdes d'encodatge pels tèxtes que las maquinas pòdon legir, mai que mai en lingüistica e en sciéncias umanas e socialas.

Aquelas preconizacions son redigidas per la TEI (Text encoding initiative[2]), un consòrci que desvolopa e manten d'un biais collectiu de nòrmas per la representacion de tèxtes jos la forma numerica. Es una organizacion a tòca pas lucrativa compausada d'institucions academicas, de còlas de recèrca e d'especialistas individuals del monde tot[3].

Structura del format TEI[modificar | Modificar lo còdi]

Dempuèi la version P4, la TEI es un jos-format del lengatge XML[4]. Aquel utiliza de balisas qu'enquadran un tròç de tèxte e lo qualifican. Aquelas balisas pòdon aver d'atributs, obligatòris o facultatius, que precisan la qualificacion.

Ex. : <pron notation="IPA">trænskrɪpʃən</pron>

La balisa <pron> enquadra lo mot "trænskrɪpʃən", indicant qu'es una prononciacion. L'atribut "notacion", qu'a coma valor "IPA", indica qu'aquela prononciacion es transcriuta en Alfabet Fonetic Internacional.

Las preconizacions[modificar | Modificar lo còdi]

Las TEI Guidelines an agut mantuna version :

  • TEI P1 (publicada en 1990)
  • TEI P2 (publicada en 1992-1993)
  • TEI P3 (publicada en 1994)
  • TEI P4 (publicada en 2002)
  • TEI P5[5] (publicada en 2007)

La version utilizada uèi es la TEI P5 v2.0.1, publicada en 2011.

Definís un cèrt nombre de balisas adaptadas a l'etiquetatge de tèxtes numerics. Per cada balisa, prepausa d'unes atributs e balha d'exemples de valors que pòdon préner.

Aquelas balisas son amassadas dins de moduls que correspondan a las diferentas utilizacions que se pòdon far de la TEI (poesia, transcripcions de discorses, diccionaris, manuscrits...).

Libertat d'utilizacion[modificar | Modificar lo còdi]

Aquelas Guidelines son publicadas en open source. I podèm accedir en linha[6], ne telecargar una version pdf[7] o ebook[8], ne far una còpia locala... D'efièit, la TEI vòl èstre un format obèrt que cadun pòt adaptar a sos projèctes[9]

Projèctes qu'utilizan la TEI[modificar | Modificar lo còdi]

Numeroses projèctes dins lo monde an causit la TEI per encodar los lors tèxtes. Podèm citar :

Nòtas e referéncias[modificar | Modificar lo còdi]

  1. http://www.tei-c.org/Guidelines/
  2. https://web.archive.org/web/20150612040042/http://www.tei-c.org/index.xml
  3. https://web.archive.org/web/20150612040042/http://www.tei-c.org/index.xml
  4. http://www.tei-c.org/Vault/P4/
  5. http://www.tei-c.org/Guidelines/P5/
  6. http://www.tei-c.org/release/doc/tei-p5-doc/en/html/
  7. http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf
  8. http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.epub
  9. http://www.tei-c.org/Guidelines/
  10. http://www.natcorp.ox.ac.uk/
  11. http://ota.ox.ac.uk/
  12. http://freedict.org/
  13. https://web.archive.org/web/20161201094506/http://www.locongres.org/oc/lo-congres/tribalhs-deu-congres/formatatge-en-tei
  14. http://dictionnaire1905.u-cergy.fr/
  15. http://txm.bfm-corpus.org/bfm
  16. http://www.perseus.tufts.edu/