Aprendissatge prigond

Un article de Wikipèdia, l'enciclopèdia liura.
Salta a la navegació Salta a la cerca
Un ret de neurònas convolutius (CNN) es une metòde d'aprendissatge automatic repausant sus l'aprendissatge prigond.

L'aprendissatge prigond[1] (en anglés deep learning, deep structured learning, hierarchical learning) es un ensemble de metòdes d'aprendissatge automatic volent modelizar amb un naut nivèl d’abstraccion de donadas mercé a d’arquitecturas articuladas de diferentas transformacions non lineàrias. Aquestas tecnicas permetèron de progrès importants e rapids dins los domènis de l'analisi del senhal sonor o visual e per exemple la reconeissença faciala, de la reconeissença vocala, de la vision per ordinator, del tractament automatizat del lengatge. Dins las annadas 2000, auquestes progrès provoquèron d’investiments privats, universitaris e publics importants, per exemple fachs pels gigants de l’internet (Google, Apple, Facebook, Amazon, Microsoft)[2].

Descripcion e contèxte[modificar | modificar la font]

Lo « deep learning » fa partit d’una familha de metòdes d'aprendissatges automatics fondats su l’aprendissatge de modèls de donadas. Una observacion (un imatge, p. ex.) se pòt representar de diferents biais per un vector de donadas, Per exemple segon:

  • l’intensitat dels pixèls qu’es constituit;
  • sas diferentas arèstas;
  • sas diferentas regions, de formas particularas.

Unas representacions e una bona capacitat d'analisi automatic de las diferenciacions[3] fasent lo pretzfach d’aprendissatge mai eficaç.

Una de las perspectivas de las tecnicas de l'aprendissatge prigond es lo remplaçament d’unas òbras, encara pro laboriosas, per de modèls algoritmics d’aprendissatge supervisat, non supervisat (es a dire demandan pas de coneissença especificas al subjècte del problèma estudiat) o alara per de tecnicas d’extraccion ierarquica de las caracteristicas.

Las recercas dins aqueste domèni s’esfòrça de bastir de representacions melhoras de real e de crear de modèls capables d’aprene aquestas representacions a partir de donadas non labelizadas a granda escalas. Unas d’aquestas representacions s’inspiran de las darrièras avançadas en neurosciéncia. S'agís, grosso modo, d'interpretacions del tractament de l’informacion e dels modèls de comunicacion del sistèma nerviós, a l'imatge del biais que lo sistèma nerviós establís de ligamss segon los messatges recebuts, de la responsa neuronala e del pes dels ligams entre las neurònas del cervèl.

Las diferentas arquitecturas de « deep learning » coma lo « deep neural networks », los « convolutional deep neural networks », e los « deep belief network » an diferents camps d’aplicacion:

Dins aquestes dos darrièrrs domènis, per exemple, obtenguèron de resultats plan prometeires.

Definicion[modificar | modificar la font]

Las tecnicas d'aprendissatge prigond constituisson una classa d’algoritmes d'aprendissatge automatic que:

  • utilizan diferentas sisas d’unitat de tractament non linear per l’extraccion e la transformacion de las caracteristicas; cada sisa prend a la dintrada la sortida de la precedenta; los algoritmes pòdon èsser supervizadas o non supervizadas, e lors aplicacions comprenon la reconeissença de modèls e la classificacion estatistica;
  • foncionan amb un aprendissatge de diferents nivèls de detalh o de representacion de donada; per las diferentas sisas, se passa de paramètres de bas nivèls a de paramètres de naut nivèl, o los diferents nivèls correspondon a difarents nivèls d’abstraccion de las donadas.

Aquestas arquitecturas permeta, uèi de conferir de « sens » a de donadas en lor donant la forma d’imatges, de sons o de tèxtes.

L'aprendissatge prigond utiliza de sias amagadas de rets de neurònas artificialas, de « maquinas de Boltzmann restrenchas », e de serias de calculs propositionals complèxes. Los algoritmes d'aprendissatge prigond s’opausan als algoritmes d’aprendissatge pauc prigonds a causa del nombre de transformacions realizadas sus las donadas entre la sisa de dintrada e la sisa de sortida, ont una transformacion correspond a una unitat de tractament definida per de peses e de lindals.

Istoric[modificar | modificar la font]

Lo concèpte d'aprendissatge prigond prend forma dins las annadas 2010, amb la convergéncia de quatre factor:

  • de rets de neurònas artificialas[6] multisisas (d’espereles eissits entre autres del concèpte de perceptron, datant de la fin de las annadas 1950) ;
  • d’algoritmes d'analisi discriminant[7] e aprenents[8] (que l'emergéncia ven de las annadas 1980) ;
  • de maquinas que la poténcia de tractament permet de tractar de las donnadas massissas;
  • de basas de donnadas pro grandas, capablas de menar de sistèmas de grandas talhas[9].

En octobre de 2015, lo programa AlphaGo, que se li aprenguèt a jogar al jòc de go mercé al metòde de l'aprendissatge prigond, venç lo campion europèu Fan Hui[10] per 5 partidas a 0. En març de 2016, lo mèsme programa venç lo campion del mond Lee Sedol per 4 partidas a 1[11].

Domènis d'aplicacion[modificar | modificar la font]

L'aprendisstage prigond s'aplica a diferents sectors de las NTIC, coma:

Lo metòde del Deep Learning es uèi utilizat per realizar de motors de traduccion automatica.

L'aprendissatge prigond pòt, per exemple, ajudar a:

  • reconéisser melhor d’objèctes nautament desformables[17] ;
  • analizar las emocions reveladas per una cara fotograficada o filmada[18] ;
  • analizar los movements e posicion dels dets d'una man, util per ex. per traduire las lengas de signes[19] ;
  • Melhorar lo posicionament automatic d'una camèra, etc.[20] ;
  • pausa, dins unes cas, un diagnostic medical (ex. : reconeissença automatica d'un càncer en imatgeria medicala[21]), o de prospectiva o de prediccion (ex. : prediccion de las proprietats d'un sol filmat per un robot[22]).
  • reproduire una òbra artistica a partir d'una fotografia a l’ordinator[23]

Una aplicacion del deep learning per la santat publica es lo projècte Horus de la societat Eyra[24]. S’agís d’un aparelh portable utilizant la plataforma NVidia Jetson, qu’ajuda los malvesents o los cecs a s’orientar e a reconeisser de personas o d’objèctes, tornant transcriure en audio un imatge captat per una camèra.

En fisica, l'aprendissatge prigond es utilizat per la recerca sus la matèria exotica[25].

Reaccions[modificar | modificar la font]

De personalitats, d’esperelas eissidas de la comunautat dels conceptors e fornisseires en tecnologias, manifestèron lor crenta de veire, de mai a mens long tèrme, l'intelligéncia artificiala passar las performanças de l'intelligéncia umana[26]. Se pòt far mencion de l'astrofisician britanic Stephen Hawking[27], un dels fondators de Microsoft, Bill Gates[28], lo PDG de Tesla, Elon Musk[29] e l’especialista en IA[30] e l’informatician Stuart Russell. D'autres, coma Raymond Kurzweil, se reclamant de la filosofia transumaniste, se’n gausisson al contrari, qualificant aquesta avançada de singularitat tecnologica.

Aquestas crentas sont relativizadas per de cercaires en intelligéncia artificiala, coma Yoshua Bengio. Aqueste darrièr estima en efièch que se foguèt largament exagerat los progrès recents de l'IA e sosestimat la lentor del procediment de melhoracion[31]. Aqueste sector reconegut estima que l'IA es encora luènh de l’estadi ont se pòt dire que l'ordinator « compren » es a dire: soslinha que percebre e crear de concèptes, es pas veraiment comprende, e afirma que manca encara quicòm de fondamental per passar lo pas[31].

Enfin, la crenta que l'IA poiriá melhorar d'esprela per escapar possiblament al contraròtle dels umans li sembla infondada per tres rasons: primièra, las tecnicas actualas, fòrça especializadas, exigissent de fòrça longs temps d'aprendissatge [32]; segonda, repausan pas sus una forma d'autoprogramacion; e tresena, l'autoprogramacion es pas un axe de recerca[31].

Son tanben evocats de possibles usatges malvolent de deep learning. Ven alara possible d'incrustar la cara d'una persona sus una autra, e a l’amagat, e de li far far o dire de causa que faguèt pas o diguèt pas, le deep learning tornant crear los movements de cara fasent l'incrustacion realista. Atal, diferntas actriças coma Gal Gadot, Emma Watson, Cara Delevingne, Emma Stone, Natalie Portman o Scarlett Johansson trobèron lor cara incrustada sus aqueste d'una actriça pornografica amb un logicial accessible al grand public nomeant Deepfakes, creant de crentas al subjècte de la generalizacion d'un tal usatge, permetent qui que siá de noire a la reputacion d'una autra persona[33]. Fàcia al dangièr, diferentas plataformas coma PornHub, Twitter e Reddit interdiguèron la publicacion de talas vidèos.

Nòtas e referéncias[modificar | modificar la font]

  1. Une source pour la traduction en apprentissage profond : modèl {{Ligam web}} : paramètre « url » mancante paramètre « titre » mancant.
  2. 2,0 et 2,1 "Deep learning" : les dessous d'une technologie de rupture, analyse prospective, Futurible. Error de citacion : Etiqueta <ref> no vàlida; el nom «Futurible2015» està definit diverses vegades amb contingut diferent.
  3. A. G. Baydin, B. A. Pearlmutter, A. A. Radul et J. M. Siskind (2015), « Automatic differentiation in machine learning: a survey », arXiv preprint arXiv:1502.05767 . 185.
  4. 4,0 et 4,1 J. Zhou et O. G. Troyanskaya (2015), « Predicting effects of noncoding variants with deep learning-based sequence model », Nature Methods, 12(10), 931-934 (résumé).
  5. 5,0 et 5,1 B. Alipanahi, A. Delong, M. T. Weirauch et B. J. Frey (2015), « Predicting the sequence specificities of DNA-and RNA-binding proteins by deep learning », Nature Biotechnology (résumé).
  6. J. Schmidhuber (2015), « Deep learning in neural networks: An overview », Neural Networks, 61, 85-117.
  7. Collobert, R. (2011). Deep learning for efficient discriminative parsing. In AISTATS'2011 . 95.
  8. D. H. Ackley, G. E. Hinton et T. J. Sejnowski (1985), « A learning algorithm for Boltzmann machines », Cognitive Science, 9, 147{169. 590.
  9. modèl {{Ligam web}} : paramètre « url » mancante paramètre « titre » mancant
  10. https://www.lemonde.fr/pixels/article/2016/01/27/premiere-defaite-d-un-professionnel-du-go-contre-une-intelligence-artificielle_4854886_4408996.html.
  11. {{{2}}}, .
  12. D. Ciresan, U. Meier, J. Masci et J. Schmidhuber (2012), « Multi-column deep neural network for traffic sign classiffication », Neural Networks, 32, 333-338. 22, 195.
  13. M. Cai, Y. Shi et J. Liu (2013), « Deep maxout neural networks for speech recognition » dans Automatic Speech Recognition and Understanding (ASRU), 2013 IEEE Workshop on, pages 291-296. IEEE. 198.
  14. P. Baldi et S. Brunak (1998), « Bioinformatics, the Machine Learning Approach », MIT Press, 579.
  15. D. Held, S. Thrun et S. Savarese (2015), « Deep Learning for Single-View Instance Recognition », arXiv preprint arXiv:1507.08286.
  16. W. Y. Lim, A. Ong, L. L. Soh et A. Sufi (2016), « Teachers’ Voices and Change: The Structure and Agency Dialectics that Shaped Teachers’ Pedagogy Toward Deep Learning », dans Future Learning in Primary Schools (pp. 147-158), Springer Singapore.
  17. I. Mariolis, G. Peleka, A. Kargakos, et S. Malassiotis (juillet 2015). Pose and category recognition of highly deformable objects using deep learning. In Advanced Robotics (ICAR), 2015 International Conference on (pp. 655-662). IEEE (résumé).
  18. S. E. Kahou, X. Bouthillier, P. Lamblin, C. Gulcehre, V. Michalski, K. Konda, … et Y. Bengio (2015). EmoNets: Multimodal deep learning approaches for emotion recognition in video. arXiv preprint arXiv:1503.01800.
  19. M. Oberweger, P. Wohlhart et V. Lepetit (2015), « Hands Deep in Deep Learning for Hand Pose Estimation », arXiv preprint arXiv:1502.06807.
  20. A. Kendall et R. Cipolla (2015), « Modelling Uncertainty in Deep Learning for Camera Relocalization », arXiv preprint arXiv:1509.05909 (résumé).
  21. A. Halpern et J. R. Smith (octobre 2015), « Deep Learning, Sparse Coding, and SVM for Melanoma Recognition in Dermoscopy Images », dans Machine Learning in Medical Imaging: 6th International Workshop, MLMI 2015, organisé en conjunction avec MICCAI 2015, Munich, Allemagne, Modèl:Date-, Proceedings (Vol. 9 352, p. 118), Springer (résumé).
  22. M. Veres, G. Lacey et G. W. Taylor (juin 2015), « Deep Learning Architectures for Soil Property Prediction » [PDF], dans Computer and Robot Vision (CRV), 2015 12th Conference on (pp. 8-15), IEEE (résumé).
  23. modèl {{Ligam web}} : paramètre « url » mancante paramètre « titre » mancant
  24. modèl {{Ligam web}} : paramètre « url » mancante paramètre « titre » mancant.
  25. P. Baldi, P. Sadowski et D. Whiteson (2014), « Searching for exotic particles in highenergy physics with deep learning », Nature Communications, 5. 23.
  26. Comment le deep learning révolutionne la recherche en intelligence artificielle, Morgane Tual, Le Monde, Modèl:Date-.
  27. Hawking : « L'intelligence artificielle pourrait mettre fin à l'humanité », Le Monde, Modèl:Date-.
  28. « Bill Gates est « préoccupé par la superintelligence » artificielle », journal Le Monde, Modèl:Date-.
  29. « Les 37 projets d’Elon Musk contre les dangers de l’intelligence artificielle », Le Monde, Modèl:Date-.
  30. « Le professeur Stuart Russell, scientifique reconnu, craint que l’intelligence artificielle ne devienne un danger pour l’humanité », Reinformation.tv, Modèl:Date-.
  31. 31,0 31,1 et 31,2 Will Machines Eliminate Us? Will Knight, MIT Technology Review, Modèl:Date-.
  32. Exigence de volumes grandissants de données, Search Business Analytics, 2017.

Vejatz tanben[modificar | modificar la font]

Articles connèxes[modificar | modificar la font]

Nocions

Logicials[modificar | modificar la font]

Teoricians[modificar | modificar la font]

Ligams extèrnes[modificar | modificar la font]

Bibliografia[modificar | modificar la font]

  • (en) Ian J. Goodfellow, Yoshua Bengio et Aaron Courville, Deep Learning, MIT Press, 2016 (ISBN 0262035618, lire en ligne) [détail des éditions]
  • Y. Bengio (2009), Learning Deep Architectures for AI, Now Publishers, 149, 195.