| Présentation | Accès aux corpus | Documentation | ![]() |
Accueil Actualité...Statistiques: Actuellement sont consultables dans l'archive: 3651 enregistrements public et 1969 en accès protégé pour un total de plus de 100 langues différentes. La troisième édition de l'école "Gestion numérique des sources de la recherche en sciences humaines et sociales" aura lieu du 8 au 12 octobre 2012 à Aussois (Alpes)... en savoir plus TELEMETA et le CRDO-Paris, avec le soutien du TGE Adonis, organisent le 30 juin 2011 une journée sur le thème "Son et corpus sonores" voir l'annonce et le programme Les Archives de la Parole ont 100 ans. Journée d'étude organisée par la BnF en collaboration avec la Délégation générale à la langue française et aux langues de France et le Laboratoire Ligérien de Linguistique... en savoir plus Un nouveau moteur de recherche à facettes pour l'ensemble des ressources linguistiques de la communauté OLAC. http://search.language-archives.org/ Annonce de la deuxième édition de l'école "Gestion numérique des sources de la recherche en sciences humaines et sociales" du 10 au 14 octobre 2011 à Aussois (Alpes)... en savoir plus COllections de COrpus Oraux NumériquesL'ancien Centre de Ressources sur la Description de l'Oral (CRDO) qui était le Centre de Ressources Numériques (CRN) centré sur les ressources orales, change son organisation et son nom.
COCOON accompagne les producteurs de ressources orales, à créer, structurer et archiver leurs corpus ; un corpus pouvant se composer d'enregistrements audio accompagnés éventuellement de d'annotations de ces enregistrements. Les ressources déposées sont dans un premier temps cataloguées et stockées, puis, dans un deuxième temps archivées dans l'archive du TGE-Adonis. L'auteur et son institution restent responsables des documents déposés et peuvent bénéficier d'un accès restreint et sécurisé à leurs données, pendant une période définie, si le contenu de l'information est considéré sensible COCOON est géré par une petite équipe de chercheurs et d'ingénieurs. Fonctionnement de COCOONLes corpus concernésLes corpus gérées ici ne sont que les ressources orales numérisées. Ne sont concernés que les enregistrements de parole accompagnés ou non de leurs annotations directes. Des contraintes de formats et de codages doivent être respectées pour déposer dans l'archive. Ces contraintes sont dues principalement à une préoccupation de maintenance et de conservation. Nous ne pouvons garantir la maintenance que des seuls fichiers dont le codage et le format sont connus, publics et ne sont pas soumis à des restrictions de droits (brevets ou autres). Une liste des formats et des codages est disponible et commentée sur ce site. L'entrepôt OAIUne "archive ouverte" est un réservoir dans lequel le dépôt des données est effectué par l'auteur lui-même ou bien par une personne ou une institution, à partir du moment où celle-ci peut garantir qu'elle détient les droits ou l'autorisation des ayants-droits pour disposer des données de la sorte. Ces ressources sont entreposées dans un serveur qui en assure un stockage sécurisé, et qui en permet l'accès. Une description de chaque document vient alors enrichir un catalogue qui permettra de faire connaître leur existence à tous et surtout de pouvoir les retrouver parmi l'ensemble des autres documents. Le rôle d'une archive ouverte se cantonne principalement à la sauvegarde, au référencement et à l'accessibilité des documents. Pour chaque dépôt public, un identifiant unique (identifiant oai) sera communiqué au dépositaire ainsi qu'une ou plusieurs URLs. L'ArchivePour assurer leur conservation sur le long terme, une copie des ressources est transférée dans l'Archive du TGE-Adonis qui utilise les services de tiers-archivage du CINES. A l'issue de ce transfert, la description des ressources se voit enrichir des nouveaux identifiants pérenne (identifiants ARK) et de dates d'archivage. Le portailL'accès aux données par le portail COCOON consiste en une simple restitution des données déposées dans un format qui en permet l'exploitation, c'est-à-dire un format standard ouvert et libre que ce soit le format d'origine du dépôt ou un nouveau format en cas d'obsolescence du format d'origine. Pour les corpus respectant certaines contraintes de structure, une interface minimale est également fournie sur le portail. Hormis cette restitution, les documents peuvent faire l'objet de valorisations extérieures, comme par exemple dans le cas de la constitution d'une collection au sein d'un projets qui définit ses propres interfaces et des outils de recherche et d'exploitation. |
![]() ![]() | Contact | Credits |
![]() | ![]() | ![]() |







