lundi 22 avril 2013

Textopol





 Bases de données textuelles :




  • FRANTEXT






L'outil de consultation de ressources informatisées sur la langue française (1992) peut être définie comme l'association d'une part d'un vaste corpus de textes littéraires français, et d'autre part d'un logiciel offrant une interface Web avec des possibilités d'interrogation de consultation et d'hyper-navigation. Historiquement, le but premier de ce corpus textuel était de permettre la constitution d'une base d'exemples destinée aux rédacteurs des articles du TLF.
L'outil de consultation Frantext contient près de 4000 textes appartenant aux domaines des sciences, des arts, de la littérature, des techniques, qui couvrent 5 siècles de littérature (du XVIe au XXIe siècle). Il est accessible sur Internet, moyennant un abonnement.
Deux versions de Frantext sont proposées :- L'intégralité de la base (4000 textes, plus de 210 millions d'occurrences, environ un millier d'auteurs). Les œuvres se répartissent pour 80% d'œuvres littéraires et 20% d'œuvres scientifiques ou techniques. Il est possible d'effectuer des recherches à différents niveaux : simples ou complexes.- Une sous-partie constituée de 1940 œuvres en prose des XIXe et XXIe siècles, soit environ 127 millions d'occurrences, qui ont fait l'objet d'un codage grammatical selon les Parties du Discours. Aux fonctionnalités du Frantext intégral, ont été ajoutées des possibilités de requêtes portant sur les codes grammaticaux.




















  • Guide d'interrogation de FRANTEXT (site de l'ENS-LSH). Rédigé par Charles Bernet
    (ICAR, UMR 5191 du CNRS) et Gisèle Kahn (CID, ENS-LSH)


CID




Le CID (Centre d'ingénierie documentaire) est une équipe de l'ENS-LSH. Il intervient dans le domaine des nouvelles technologies documentaires au service de l'enseignement et de la recherche en lettres et sciences humaines.
Le CID mène des activités de formation : programme « technologies, lettres et sciences humaines » (voir Formations technologiques) ; sélection commentée de sites web en LSH (voir Bibliothèque virtuelle) ; base d'articles sur l'utilisation des outils informatiques en LSH (voir Aide au chercheur).
Le CID participe également à des programmes de recherche tels que : CTLF (Corpus de textes linguistiques fondamentaux), E-JAD (Journaux électroniques d'Alexandre Dumas), RefWorks ENS-LSH (bibliographie en ligne).
Quelques-uns des outils qu'il développe sont librement téléchargeables (fichiers de configuration et styles Endnote, styles RefWorks, modèles Word) : voir Aide au chercheur.


















  • POLITEXT




POLITEXT recueille des discours, bruts ou traités par Hyperbase, des grands locuteurs politiques de l’époque contemporaine. Cette base de textes a été réalisée par reproduction manuelle de manuscrits, par océrisation d’éditions papier, par téléchargement de discours disponibles et grâce aux dons de discours numérisés de plusieurs chercheurs.



http://www.unice.fr/ILF-CNRS/politext/











  • DOCUMENTATION FRANÇAISE (Bibliothèque des discours publics)




La Collection des discours publics rassemble plus de 100 000 textes rendus accessibles aux citoyens, émanant des principaux acteurs de la vie politique, Président de la République, gouvernement, responsables politiques et syndicaux.
La liste des discours récents correspond aux mises à jour quotidiennes. Les 50 derniers discours et communiqués mis en ligne sont proposés.
Une rubrique éditoriale permet de rapprocher une actualité faisant débat d’une sélection de positions déjà prises sur le sujet














 Autres ressources :


INALF
http://www.inalf.fr/








ATALA (Association pour le Traitement Automatique des Langues)















http://www.atala.org/








RESSOURCES ELECTRONIQUES EN SCIENCES HUMAINES ET SOCIALES








http://urfist.enc.sorbonne.fr/








ARTFL Project. Université de Chicago



The Project for American and French Research on the Treasury of the French Language (ARTFL) is a cooperative enterprise of the Laboratoire ATILF (Analyse et Traitement Informatique de la Langue Française) of the Centre National de la Recherche Scientifique (CNRS), the Division of the Humanities, the Division of the Social Sciences, and Electronic Text Services (ETS) of the University of Chicago.




www.lib.uchicago.edu/efts/ARTFL/newhome/texts








DICTIONNAIRES






http://clicnet.swarthmore.edu/dictionnaires.html





(attention, beaucoup de liens morts!)





sur le site de la Sorbonne j'ai trouvé cela:





http://urfist.enc.sorbonne.fr/cerise/lexdico.htm







Online Linguistics Glossaries






http://ccms.ntu.edu.tw/~karchung/linguistics0links.htm







 Revues électroniques :








PORTAIL DES REVUES SCIENTIFIQUES EN LIGNE
http://www.revues.org/
cité plus loin...







LEXICOMETRICA





La revue LEXICOMETRICA s'adresse aux chercheurs, aux étudiants, aux professionnels de la communication et de la fouille de données textuelles... intéressés par les travaux théoriques et pratiques menés dans les domaines suivants : Lexicométrie / statistique textuelle, linguistiques de corpus, extraction d'informations à partir de corpus de texte, acquisition de connaissances...Elle est publiée sur Internet et rassemble des articles de recherche ou des comptes-rendus d'expériences. Assisté d'un réseau de correspondants, son comité de rédaction sélectionne les articles à paraître. Un sommaire à double entrée permet d'accéder aux articles à la fois par date de parution (Parcours Chronologique) et par thème (Parcours Thématique).






http://www.cavi.univ-paris3.fr/lexicometrica/





LANGAGE ET SOCIETE



http://www.l-et-s.msh-paris.fr/





Source internethttp://textopol.free.fr/

Aucun commentaire:

Enregistrer un commentaire