Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
teaching:mfe:ia [2014/05/05 19:26]
mdorigo +1 proposal
teaching:mfe:ia [2015/03/26 14:56]
bersini [Contribution au développement de la platerorme Big Data d'IRIDIA]
Line 11: Line 11:
  
 Ce mémoire se fera en collaboration avec l'​équipe médicale du centre pour l'​anorexie et la boulimie de l'​hôpital Erasme. Il consistera en l'​analyse informatisée des données récoltées lors d'​entretiens avec le patient et sa famille au cours du traitement. Les données sont actuellement stockées dans dans une base de données SPSS.  Le mémoire consistera pour l'​essentiel au traitement de ces données par des approches "​Machine Learning"​ et "Data Mining"​ dans une perspective de Quality Management. ​ Ce mémoire se fera en collaboration avec l'​équipe médicale du centre pour l'​anorexie et la boulimie de l'​hôpital Erasme. Il consistera en l'​analyse informatisée des données récoltées lors d'​entretiens avec le patient et sa famille au cours du traitement. Les données sont actuellement stockées dans dans une base de données SPSS.  Le mémoire consistera pour l'​essentiel au traitement de ces données par des approches "​Machine Learning"​ et "Data Mining"​ dans une perspective de Quality Management. ​
 +
 +  * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
 +
 +===== Développer un programme informatique permettant une analyse statistique en vue de  l'​évaluation d'un module psychothérapeutique. =====
 +
 +Ce mémoire se fera en collaboration avec l'​équipe médicale du centre pour l'​anorexie et la boulimie de l'​hôpital Erasme. Il consistera en l'​analyse informatisée des données récoltées lors d'​entretiens avec le patient et sa famille au cours du traitement. Les données sont actuellement stockées dans dans une base de données SPSS.  Le mémoire consistera pour l'​essentiel au traitement de ces données par des approches "​Machine Learning"​ et "Data Mining"​ dans une perspective de Quality Management. ​
 +
 +  * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
 +
 +===== Contribution au développement de la plateforme Big Data d'​IRIDIA =====
 +
 +Dans de nombreux projets d'​enseignement et d'​industrie dans lesquels IRIDIA se trouvent impliqués, des demandes pressantes nous sont faites de formation et d'​utilisation des outils Big Data (Map-Reduce,​ Cloudera, Hue, Hive, Pig, Elastic Search, HBase). Nous répondons tant bien que mal à ces demandes et tentons d'​équiper notre cluster avec les logiciels demandés. Le mémoire consisterait en une étude comparative de l'​existant en terme surtout logiciel et la mise en place d'un cours mettant en évidence les avantages de l'une ou l'​autre solution en ce compris par rapport à des solutions plus conventionnels de type BD relationnelle.
  
   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
Line 16: Line 28:
 ===== Contribution à l'​amélioration de la plateforme génomique In Silico DB ===== ===== Contribution à l'​amélioration de la plateforme génomique In Silico DB =====
  
-Une nouvelle spin-off a vu le jour depuis un an à IRIDIA: In Silico DB (https://​insilicodb.org/​) mettant à disposition sous une forme aisément exploitable des centaines de milliers d'​échantillons de données génomiques permettant un meilleur diagnostic des maladies d'​origine génétique et une meilleure compréhension de la biologie moléculaire. L'​équipe qui s'en occupe a un besoin pressant de développeurs informatiques permettant d'en améliorer l'​interface. Des connaissances en programmation Web sont souhaitées. ​+Une nouvelle spin-off a vu le jour depuis un an à IRIDIA: In Silico DB (https://​insilicodb.org/​) mettant à disposition sous une forme aisément exploitable des centaines de milliers d'​échantillons de données génomiques permettant un meilleur diagnostic des maladies d'​origine génétique et une meilleure compréhension de la biologie moléculaire. L'​équipe qui s'en occupe a un besoin pressant de développeurs informatiques permettant d'en améliorer l'​interface. Des connaissances en programmation Web sont souhaitées. La migration du système de stockage sur un serveur Big Data est aussi un des objectifs actuellement poursuivis par l'​équipe en place et permettra au mémorant de se familiariser avec ces nouvelles technologies.
  
   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
Line 24: Line 36:
  
 Depuis quelques années, Microsoft met en avant un nouveau langage de programmation F# créé dans le sillage des langages dits déclaratifs ou fonctionnels. Il semblerait que ce langage soit idéal pour le traitement des données. Le MFE consistera en une étude expérimentale de ce langage et un comparatif avec les langages de programmation aujourd'​hui les plus usités. ​ Depuis quelques années, Microsoft met en avant un nouveau langage de programmation F# créé dans le sillage des langages dits déclaratifs ou fonctionnels. Il semblerait que ce langage soit idéal pour le traitement des données. Le MFE consistera en une étude expérimentale de ce langage et un comparatif avec les langages de programmation aujourd'​hui les plus usités. ​
 +
 + * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
 +
 +===== Etude de l'​algorithme du Deep Learning =====
 +
 +Les réseaux de neurones multicouches sont redevenus très à la mode depuis que Google les utilise massivement pour le traitement automatique d'​images et de vidéos. Nous avons à IRIDIA étudié et réalisé plusieurs algorithmes d'​apprentissage de ces réseaux multicouches. Le mémoire consistera en une comparaison des algorithmes de deep learning tels ceux utilisés chez Google et les alternatives que nous proposons ici à IRIDIA depuis plusieurs années.
  
  * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​  * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
Line 33: Line 51:
 élémentaire et sa membrane. L'​idée est de réaliser le logiciel minimal capable de simuler un organisme vivant. Cette cellule devra être capable élémentaire et sa membrane. L'​idée est de réaliser le logiciel minimal capable de simuler un organisme vivant. Cette cellule devra être capable
 de croître et de spontanément se dupliquer. Il fera suite de croître et de spontanément se dupliquer. Il fera suite
-à une succession de MFE déjà réalisés ces dernières années.+à une succession de MFE déjà réalisés ces dernières années. Parmi les amélirations possibles sont en cours la parallélisation du programme suivant une technologie Big Data ou le recours aux processeurs GPU.
  
  
Line 84: Line 102:
 ===== Expérimentation des designs patterns pour la modélisation de systèmes biologiques complexes ===== ===== Expérimentation des designs patterns pour la modélisation de systèmes biologiques complexes =====
  
-Tout bon informaticien se doit aujourd’hui de maîtriser ces recettes de conception OO que sont les designs patterns. Au-delà des langages de programmation ou de modélisation (UML), ils sont devenus le sujet d’étude et de développement le plus prisé de la communauté informatique. Leur maîtrise permet à ces mêmes informaticiens d’attaquer la simulation de procédés complexes avec plus de facilité. Le MFE consistera en la mise en pratique de ces designs patterns pour la modélisation de systèmes biologiques complexes comme le système immunitaire ou les mécanismes de régulations génétiques. Le travail devrait déboucher sur une adaptation de ces mêmes designs patterns au monde et aux problèmes de la biologie.+Tout bon informaticien se doit aujourd’hui de maîtriser ces recettes de conception OO que sont les designs patterns. Au-delà des langages de programmation ou de modélisation (UML), ils sont devenus le sujet d’étude et de développement le plus prisé de la communauté informatique. Leur maîtrise permet à ces mêmes informaticiens d’attaquer la simulation de procédés complexes avec plus de facilité. Le MFE consistera en la mise en pratique de ces designs patterns pour la modélisation de systèmes biologiques complexes comme le système immunitaire ou les mécanismes de régulations génétiques. Le travail devrait déboucher sur une adaptation de ces mêmes designs patterns au monde et aux problèmes de la biologie. Ce mémoire se fera en collaboration avec l'​institut de recherche de Microsoft à Cambridge qui a déjà supervisé les mémorants précédents
  
   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]]   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]]
Line 102: Line 120:
  
   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]]   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]]
 +
  
  
Line 110: Line 129:
   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]]   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]]
  
-===== Mise au point d’un système automatique ​de génération d'​équations différentielles au départ d’un diagramme d’état-transition ​=====+===== Mise en place de solutions Big Data et Elastic Search pour les réseaux bibliométriques  ​===== 
 + 
 +Les publications scientifiques doivent se citer entres elles. Elles constituent donc un immense réseau de citations. Nous étudions à IRIDIA la nature de ce réseau et l'​impact que peut avoit une publication scientifique en suivant dans le temps le nombre de nouvelles publications qui citent cette dernière. Comme ces réseaux sont de taille gigantesque (des millions de publications),​ des solutions technologiques harwarde et software de type Big Data et Elastic Search sont mises en place et expérimentées ici à IRIDIA. Le mémoire consistera en un développement et une expérimentation des ces possibles solutions.  
 + 
 +* Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]]
  
-Le diagramme d’état-transition représente le cycle de vie d’un objet, de sa naissance à sa disparition,​ en suivant les différents états par lesquels cet objet transite. Lorsqu'​il s'agit d'​objets biologiques,​ il est possible de ré-interpréter ce diagramme comme la transition d'​une ​ 
-partie d'une population d'​objets dans un certain d'​état dans l'​état qui 
-suit. Dans ce cas, ce diagramme peut se traduire sous forme d'un système 
-d'​équations différentielles que l'on devra pouvoir générer automatiquement. ​ 
  
-  * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] 
-  *  
 ===== Mise au point d’un langage de modélisation de systèmes biologiques inspiré des diagrammes de classe et d'​état/​transition UML ===== ===== Mise au point d’un langage de modélisation de systèmes biologiques inspiré des diagrammes de classe et d'​état/​transition UML =====
  
Line 453: Line 470:
  
  
-===== Simulation et optimisation de trafic routier ​=====+===== Localisation and tracking of components in self-assembling systems ​=====
  
-Mentis, spin-off du laboratoire IRIDIA, est une société de consultance +The goal of this project is to apply computer vision techniques to track the growth of structures in self-assembling systemsThe ability to track the growth of structures will shed light on the dynamics of self-assembly;​ an aspect of self-assembly that has not been well researched in the macroscopic context.
-spécialisée en Data Mining et en Text Mining ​Mentis cherche +
-actuellement des mémorants pour lancer diverses études d’optimisation +
-dans le domaine de la simulation de trafic routier.+
  
-Dans le cadre d’un projet pour un de ses clientsMentis travaille +As part of the projectthe student will have to: (a) find suitable hardware (combination of camera, lens, lighting, etc.), (b) localise multiple components in an environment,​ (c) track the components in the environment,​ and (d) track the assembly of components in the environment.
-actuellement dans le domaine de la simulation de trafic routier. +
-L’objectif du mémoire proposé consiste à lancer plusieurs études +
-d’optimisation pour évaluer l’impact de différentes politiques +
-routières sur le trafic. ​ Il sera demandé à l’étudiant de mettre en +
-œuvre diverses techniques d’optimisation afin de déterminer les +
-politiques routières optimales. Une grande partie du mémoire sera +
-faite dans les bureaux de Mentis ainsi qu’en interaction directe avec +
-le client.+
  
 +Required skills: the candidates should be able to program in C++ and have a working knowledge of the English language.
  
-  ​* Contacts: ​ + * Contacts : [[http://​iridia.ulb.ac.be/​~mdorigo/​HomePageDorigo/ | Marco Dorigo]] and Dhananjay Ipparthi ​(IRIDIA)
-    * [[psener@mentis-consulting.be|Pierre Sener (Mentis)]]  +
-    * [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]]  +
-    * [[http://​iridia.ulb.ac.be/​~stuetzle/|Thomas Stützle ​(IRIDIA)]]+
  
  
Line 554: Line 558:
     * [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​     * [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
    
- 
-===== Comparison of fast heuristics for the longest common subsequence problem ===== 
- 
-The [[http://​en.wikipedia.org/​wiki/​Longest_common_subsequence|longest common subsequence (LCS) problem]] has important applications in Computational Biology. Several heuristic methods have been proposed to obtain approximate solutions. These methods require different computation time and obtain solutions of varied quality. In this project, the student will learn several methods that have been proposed in the literature to tackle a difficult optimization problem, and compare them in terms of computation time and quality of the resulting solutions. The final goal is to propose appropriate combinations of existing methods that solve diverse instances of the LCS problem. ​ 
- 
-  * Contacts :  
-    * [[http://​iridia.ulb.ac.be/​~manuel|Manuel López-Ibáñez (IRIDIA)]] 
-    * [[http://​iridia.ulb.ac.be/​~stuetzle|Thomas Stützle (IRIDIA)]] ​ 
  
  
 
teaching/mfe/ia.txt · Last modified: 2024/07/01 16:15 by stuetzle