RSS twitter Login
ELRA-ELDA-Logo.png
Home Contact Login

Share this page!
twitter google-plus linkedin share

In this section, you will find the internship position(s) currently available at ELDA/ELRA.

Sujet : Mise en place et déploiement d'un framework de services Web pour le Traitement automatique des langues

  • Niveau : M2 / dernière année d'école d'ingénieur
  • Domaine : informatique
  • Période : à partir de janvier 2017
  • Durée : 6 mois

 

Travail à réaliser

Au sein de l'équipe de développement informatique d'ELDA, sous la tutelle d'un ingénieur spécialiste des technologies de la langue et du développement d'applications Web, vous serez amené à participer aux travaux suivants :

  • faire un état de l'art rapide sur les solutions de déploiement de services Web de traitement du langage naturel ;
  • faire un état de l'art sur les gestionnaires de flux de traitement ;
  • participer à la mise en production et au déploiement chez ELDA d'une solution à base de services Web orientée traitement des langues ;
  • participer à la spécification d'un ensemble de services Web réunissant des traitements spécifiques à certaines plates-formes de production d'ELDA ;
  • implémenter les connecteurs entre ces plates-formes de production et la solution de déploiement de services Web mise en production chez ELDA ;
  • implémenter un moteur de recherche exhaustive à travers tous les actes de la conférence LREC, compte tenu des contraintes dégagées lors des étapes antérieures ;
  • exposer les plates-formes de production choisies sous forme de services Web ;
  • documenter rigoureusement toutes les étapes de ce processus.

Vos participerez également aux réunions périodiques de l'équipe de développements logiciels d'ELDA.

 

Profil souhaité

  • BAC + 5 / Dernière année d'École d'ingénieur ;
  • Connaissances solides en algorithmique ;
  • Connaissances de base des architectures des applications Web ;
  • Intérêt pour le domaine du Traitement automatique des langues (TAL) ;
  • Connaissances pratiques de programmation en Java (ou Scala, Clojure) et / ou Python ;
  • Connaissance pratique d'un logiciel de gestion de versions (Git, Mercurial ou SVN) ;
  • Capacités rédactionnelles en anglais technique ;
  • Nationalité d'un pays membre de l'Union Européenne ou droit au séjour en France pendant toute la durée du stage.

 

Candidature

Ce stage, d'une durée de 6 mois et basé à Paris dans le 13e arrondissement (Les Gobelins), est à pourvoir en janvier 2017.

Les candidatures (CV, lettre de motivation) doivent être adressées à Vladimir Popescu (vladimir@elda.org).

Le stage fait l'objet d'une rémunération, variable en fonction du niveau d'études du candidat.

www.elda.org

-*-*-*-*-*-*-*-

Acteur majeur des technologies de la langue, ELDA (« Agence pour la Distribution des ressources Linguistiques et l’Evaluation ») est une PME dont les activités s'articulent principalement autour de la distribution et de la production de ressources linguistiques. ELDA prend en charge ces activités pour le compte d’ELRA, l’Association européenne pour les ressources linguistiques, association européenne à but non-lucratif assurant la promotion des ressources linguistiques dans un contexte européen.

Ainsi, ELDA apporte son soutien à ELRA pour l'organisation de LREC, la conférence pour les ressources linguistiques et l’évaluation. Depuis 1998, cette conférence bisannuelle de portée internationale réunit, à chaque édition, des centaines de chercheurs de premier rang du monde entier, qui soumettent et présentent des articles de recherche scientifique.

Afin de faciliter la navigation dans ce thésaurus d'articles scientifiques, ELDA a mis en place un ensemble de sites Web recensant ces articles-mêmes, ainsi que des informations les concernant (auteurs, titres, résumés des articles, etc.).

Dans ce contexte, ELDA souhaite consolider ces sites, en permettant à l’utilisateur d'effectuer des recherches exhaustives au moyen d’un moteur robuste dans la totalité des collections d'articles correspondant à toutes les éditions de la conférence LREC.

 

 

Subject: Setup and Deployment of a Web service framework for Natural language processing

  • Studies: MSc.
  • Field: Computer Science
  • Provisional starting date: January 2017
  • Duration: 6 months

Duties

In the software development team at ELDA and under the supervision of an Engineer specialised in Natural Language Processing and Web Application Development, you will participate in the following tasks:

  • provide a concise state of the art on the natural language processing-oriented web service deployment solutions;
  • provide a state of the art on the workflow managers;
  • participate in the production setup and deployment of a Natural Language Processing-oriented Web service solution;
  • participate in the specification of a set of Web services which aggregate several processing stages associated to some of ELDA's language resource production platforms;

  • implement binders between these production platforms and the Web service deployment solution set-up at ELDA;
  • expose the chosen production platforms as Web services;
  • thoroughly document all the milestones of this process.

You will also participate in the regular meetings of the software development team at ELDA.

Requirements

  • MSc. in Computer Science, in a public or state-accredited higher education institution;
  • Solid algorithmic knowledge;
  • Basic knowledge in Web applications architecture;
  • Interest in the Natural Language Processing domain;
  • Hands-on programming knowledge in Java (or Scala, Clojure) and / or Python;
  • Hands-on knowledge of a revision control system (Git, Mercurial or SVN);
  • Hands-on knowledge of a database system (ideally PostgreSQL);
  • Technical writing skills in English;
  • Citizenship of a European Union Country or residency right in France during the whole duration of the internship.

Application

This 6-month internship is based in Paris 13th district (Les Gobelins).
It should start in January 2017.

Applicants should email a cover letter addressing the points listed above together with a curriculum vitæ to Vladimir Popescu (vladimir@elda.org).

The internship is subject to a monthly allowance, commensurate with the candidate's educational qualifications and according to the French laws.

www.elda.org

-*-*-*-*-*-*-*-

ELDA ("Evaluations and Language resources Distribution Agency") is a key player of the Human Language Technology domain. Operational body of ELRA, the European Language Resources Association, a European not-for-profit organisation promoting language resources in a European context, ELDA is in charge of executing a number of tasks on behalf of ELRA, including both the distribution and the production of Language Resources. Within the production projects, ELDA is often in the position of coordinating resource annotations, as well as performing quality control of these annotations.

Thus, ELDA supports the organization of ELRA’s biannual international scientific conference, LREC, the Language Resources and Evaluation Conference, which brings together, an increasing number (1200+) of top-tier researchers from all over the world, who submit and present scientific research articles.

In order to ease the navigation in this thesaurus of scientific articles, ELDA has set up a set of Web sites gathering the articles themselves, as well as the corresponding metadata (authors, titles, article abstracts, etc.).

In this context, ELDA wants to consolidate these sites, allowing the users to rely on a robust and exhaustive search throughout the article collections for all the editions of the LREC conference.

  

Sujet : Développement d'un moteur de recherche robuste pour naviguer dans des collections de documents

  • Niveau : M2 / dernière année d'école d'ingénieur
  • Domaine : informatique
  • Période : à partir de janvier 2017
  • Durée : 6 mois

Travail à réaliser

Au sein de l'équipe de développement informatique d'ELDA, sous la tutelle d'un ingénieur spécialiste des technologies de la langue et du développement d'applications Web, vous serez amené à participer aux travaux suivants :

  • faire un état de l'art exhaustif des possibilités offertes aujourd’hui par les moteurs de recherche les plus puissants, tels que Solr, Elasticsearch, ou bien les facilités de recherche textuelle offertes par des SGBD (Système de Gestion des Bases de Données) tels que PostgreSQL.
  • participer à la spécification des besoins de recherche textuelle dans les actes de la conférence LREC ;
  • participer au choix de la solution technique la plus appropriée pour les actes de LREC ;
  • participer à la conception de la structure d'une base de données (schéma de données) pour modéliser le contenu des sites Web recensant les articles de la conférence LREC ;
  • extraire les informations pertinentes des sites recensant les articles de la conférence LREC et réaliser la mise en données de ces informations, utilisant le schéma de données mentionné ci-dessus ;
  • implémenter un moteur de recherche exhaustive à travers tous les actes de la conférence LREC, compte tenu des contraintes dégagées lors des étapes antérieures ;

Vos participerez également aux réunions périodiques de l'équipe de développements logiciels d'ELDA.

 

Profil souhaité

  • BAC + 5 / Dernière année d'École d'ingénieur ;
  • Connaissances de base en algorithmique ;
  • Connaissances de base des architectures des applications Web ;
  • Maîtrise d'au moins un des langages Python et / ou JavaScript ;
  • Connaissance pratique d'un système de gestion de bases de données (PostgreSQL de préférence) ;
  • Anglais technique ;
  • La connaissance d'un moteur de recherche (Solr, Elasticsearch, Lucene) sera appréciée.

 

Candidature

Ce stage, d'une durée de 6 mois et basé à Paris dans le 13e arrondissement (Les Gobelins), est à pourvoir en janvier 2017.

Les candidatures (CV, lettre de motivation) doivent être adressées à Vladimir Popescu (vladimir@elda.org).

Le stage fait l'objet d'une rémunération, variable en fonction du niveau d'études du candidat.

www.elda.org

-*-*-*-*-*-*-*-

Acteur majeur des technologies de la langue, ELDA (« Agence pour la Distribution des ressources Linguistiques et l’Evaluation ») est une PME dont les activités s'articulent principalement autour de la distribution et de la production de ressources linguistiques. ELDA prend en charge ces activités pour le compte d’ELRA, l’Association européenne pour les ressources linguistiques, association européenne à but non-lucratif assurant la promotion des ressources linguistiques dans un contexte européen.

Ainsi, ELDA apporte son soutien à ELRA pour l'organisation de LREC, la conférence pour les ressources linguistiques et l’évaluation. Depuis 1998, cette conférence bisannuelle de portée internationale réunit, à chaque édition, des centaines de chercheurs de premier rang du monde entier, qui soumettent et présentent des articles de recherche scientifique.

Afin de faciliter la navigation dans ce thésaurus d'articles scientifiques, ELDA a mis en place un ensemble de sites Web recensant ces articles-mêmes, ainsi que des informations les concernant (auteurs, titres, résumés des articles, etc.).

Dans ce contexte, ELDA souhaite consolider ces sites, en permettant à l’utilisateur d'effectuer des recherches exhaustives au moyen d’un moteur robuste dans la totalité des collections d'articles correspondant à toutes les éditions de la conférence LREC.

 

 

Subject: Developing a robust search engine for navigating through document collections

  • Studies: MSc.
  • Field: Computer Science
  • Provisional starting date: January 2017
  • Duration: 6 months

Duties

In the software development team at ELDA and under the supervision of an Engineer specialised in Natural Language Processing and Web Application Development, you will participate in the following tasks:

  • produce a state-of-the-art overview on most powerful research engines that are currently available, such as Solr, Elasticsearch, or the full-text search features provided by current database systems, such as PostgreSQL.
  • help specifying the full-text search needs for the LREC conference proceedings;
  • help choosing the technical solution that best fits the context;
  • participate in the design of a database structure (data schema) for the contents of the LREC proceedings web sites;
  • harvest the LREC proceedings sites and populate the aforementioned database with all the relevant information extracted from the contents of the LREC proceedings sites;
  • implement a search solution that is exhaustive, robust and works throughout all the LREC proceedings.

You will also participate in the regular meetings of the software development team at ELDA.

Requirements

  • MSc. in Computer Science;
  • Basic knowledge in data structures and algorithms;
  • Basic knowledge in Web applications architecture;
  • Python and / or JavaScript language skills;
  • Technical English
  • Hands-on knowledge of a database system (ideally PostgreSQL);
  • Knowledge of a search engine (Solr, Elasticsearch, Lucene) will be appreciated.

Application

This 6-month internship is based in Paris 13th district (Les Gobelins).
It should start in January 2017.

Applicants should email a cover letter addressing the points listed above together with a curriculum vitæ to Vladimir Popescu (vladimir@elda.org).

The internship is subject to a monthly allowance, commensurate with the candidate's educational qualifications and according to the French laws.

www.elda.org

-*-*-*-*-*-*-*-

ELDA ("Evaluations and Language resources Distribution Agency") is a key player of the Human Language Technology domain. Operational body of ELRA, the European Language Resources Association, a European not-for-profit organisation promoting language resources in a European context, ELDA is in charge of executing a number of tasks on behalf of ELRA, including both the distribution and the production of Language Resources. Within the production projects, ELDA is often in the position of coordinating resource annotations, as well as performing quality control of these annotations.

Thus, ELDA supports the organization of ELRA’s biannual international scientific conference, LREC, the Language Resources and Evaluation Conference, which brings together, an increasing number (1200+) of top-tier researchers from all over the world, who submit and present scientific research articles.

In order to ease the navigation in this thesaurus of scientific articles, ELDA has set up a set of Web sites gathering the articles themselves, as well as the corresponding metadata (authors, titles, article abstracts, etc.).

In this context, ELDA wants to consolidate these sites, allowing the users to rely on a robust and exhaustive search throughout the article collections for all the editions of the LREC conference.

ELRA Tweets