Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
teaching:mfe:ia [2019/02/18 12:15]
bersini
teaching:mfe:ia [2022/11/30 13:34] (current)
stuetzle [Text Categorisation and quality control through automatic language processing]
Line 1: Line 1:
-====== MFE 2018-2019 : Intelligence Artificielle ======+====== MFE 2022-2023 : Intelligence Artificielle ======
  
 ===== Introduction ===== ===== Introduction =====
  
-Le laboratoire IRIDIA aborde des problèmes dans le domaine de l'​Intelligence Artificielle. Si l'on reprend les dires d'un de ses pioniers Marvin ​Lee Minsky, l'​Intelligence Artificielle est définit comme "la construction de programmes informatiques qui s'​adonnent à des tâches qui sont, pour l'​instant,​ accomplies de façon plus satisfaisante par des êtres humains car elles demandent des processus mentaux de haut niveau tels que : l'​apprentissage perceptuel, l'​organisation de la mémoire et le raisonnement critique"​. L'IA a beaucoup évolué depuis et s'​inspire largement de phénomènes biologiques,​ physiques, cognitifs ou encore écologiques. C'est donc définitivement une approche transdisciplinaire qui s'​accorde principalement à traîtrer ​des problèmes très complexes. Les domaines principaux de compétence d'​IRIDIA sont : l'​intelligence en essaim, les métaheuristiques,​ l'​étude des réseaux biologiques et l'​application de Business Intelligence. C'est dans cette perspective que les sujets de MFE présentés ci-après s'​inscrivent.+Le laboratoire IRIDIA aborde des problèmes dans le domaine de l'​Intelligence Artificielle. Si l'on reprend les dires d'un de ses pioniers Marvin Minsky, l'​Intelligence Artificielle est définit comme "la construction de programmes informatiques qui s'​adonnent à des tâches qui sont, pour l'​instant,​ accomplies de façon plus satisfaisante par des êtres humains car elles demandent des processus mentaux de haut niveau tels que : l'​apprentissage perceptuel, l'​organisation de la mémoire et le raisonnement critique"​. L'IA a beaucoup évolué depuis et s'​inspire largement de phénomènes biologiques,​ physiques, cognitifs ou encore écologiques. C'est donc définitivement une approche transdisciplinaire qui s'​accorde principalement à traîter ​des problèmes très complexes. Les domaines principaux de compétence d'​IRIDIA sont : l'​intelligence en essaim, les métaheuristiques,​ l'​étude des réseaux biologiques et l'​application de Business Intelligence ​et du Big Data. C'est dans cette perspective que les sujets de MFE présentés ci-après s'​inscrivent.
  
-Ces sujets sont prêt à être encadrer, mais il va s'en dire qu'ils ne sont pas uniques. Les étudiants sont vivement encouragés à prendre contact avec Hugues Bersini (bersini AT ulb.ac.be) ​ou Marco Dorigo (mdorigo AT ulb.ac.be) afin de discuter de l'une ou l'​autre initiative inspirée pouvant faire l'​objet dun autre sujet de MFE ou de préciser le cadres, le contenu et les attentes relatives au sujets présentés.+Ces sujets sont prêt à être encadrer, mais il va s'en dire qu'ils ne sont pas uniques. Les étudiants sont vivement encouragés à prendre contact avec Hugues Bersini (bersini AT ulb.ac.be)Marco Dorigo (mdorigo ​AT ulb.ac.be) ou Mauro Birattari (mbiro ​AT ulb.ac.be) afin de discuter de l'une ou l'​autre initiative inspirée pouvant faire l'​objet dun autre sujet de MFE ou de préciser le cadres, le contenu et les attentes relatives au sujets présentés.
  
  
 --- ---
-=====  A WebGL Visualization for a Swarm Robotics Simulator ​ ===== 
- 
-ARGoS is a multi-robot simulator that has been designed to simulate swarms of 1000s of robots in real time. The simulator is modular and allows developers to easy add new plugins such as physics engines, visualizations,​ and new sensors and actuators. The goal of this master’s thesis is to develop a WebGL-based visualization for the ARGoS simulator. This interface will allow a user to monitor and to interact with the simulation from a web browser. 
- 
-Required skills: The candidates should have some experience with programming in C++ and Javascript and to have some experience with HTML5 and CSS. A working knowledge of the English language is required. 
- 
-* Contact: Marco Dorigo 
- 
  
  
Line 51: Line 43:
  
   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
 +
  
 ===== Développer un programme informatique permettant une analyse statistique en vue de  l'​évaluation d'un module psychothérapeutique. ===== ===== Développer un programme informatique permettant une analyse statistique en vue de  l'​évaluation d'un module psychothérapeutique. =====
Line 58: Line 51:
   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
  
-===== Développer des solutions de text mining pour la société Procter & Gamble ===== 
  
-Ce mémoire se fera en collaboration avec des responsables marketing de cette société. Il consistera en l'​analyse informatisée des appréciations récoltées sur les produits de la firme et d'une analyse comparative avec les appréciations de concurrents. Il s'​agira pour l'​essentiel d'​études de type "​clustering",​ "​classification"​ et "​sentiment analysis"​ au départ de nombreuses librairies déjà existantes. ​+===== Développer des solutions de text mining pour la société Procter & Gamble ou dans le domaine juridique ===== 
 + 
 +Ce mémoire se fera en collaboration avec des responsables marketing de cette société ​ou avec des reponsables du monde juridique. Il consistera en l'​analyse informatisée des appréciations récoltées sur les produits de la firme et d'une analyse comparative avec les appréciations de concurrents. Il s'​agira pour l'​essentiel d'​études de type "​clustering",​ "​classification"​ et "​sentiment analysis"​ au départ de nombreuses librairies déjà existantes. ​ 
 + 
 +Dans le cas du monde juridique, il s'​agira de processus d'​organisation et d'​indexation automatique des documents juridiques
  
   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​   * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
 +
 +===== Le data mining en tant qu’outil d’aide à la gestion active d’actifs cotés ​ =====
 +
 +L’idée de ce mémoire serait d’avoir un travail en plusieurs parties dont notamment : 
 +• une partie théorique qui reprendrait les fondamentaux du data mining, ​
 +• un screening, une présentation et comparaison des outils existants utilisés dans le cadre de la gestion d’actifs cotés,
 +• une partie pratique destinée à construire un data set et à le modéliser.
 +
 +
 +  * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
 +
 +
 +===== Speed-up Techniques for Shortest Path Problems =====
 +
 +
 +The shortest path problem is one of the most important in combinatorial optimization and has multiple real-world applications.
 +The well-known Dijkstra algorithm solves the shortest path problem in any weighted graph with non-negative weights. However, with the recent increase of the amount of data, we feel the need to drastically increase the execution time of the algorithm.
 +In the latest years, we observe the emergence of a lot of new speed-up techniques; among them there are: heuristic search, bidirectional search, landmarks, reaches, short-cuts and contractions. The efficiency of these techniques heavily depends on the topology of the graph. Moreover, graphs with more complex structures (as user-adapted graphs) do not support some of these techniques, at least as they are currently presented.
 +From these observations,​ several questions arise, among them we propose:
 +Which optimization methods are the most efficient depending on the graph topology?
 +How can we adapt these techniques to more complex graph structures?
 +Other research questions in this topic can be proposed and discussed.
 +These questions can be studied from both theoretical and empirical approach. ​
 +
 +  * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
 +
 +===== Développer des solutions de data mining pour la société BMW Group Belux =====
 +
 +Ce mémoire se fera en collaboration avec des responsables marketing et techniques de cette société. ​
 +Les sujets pourraient couvrir tout ce qui concerne les data, tant les data dites de campagne, communication,​ que celles liées à la production ou aux véhicules connectés.
 +  * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
 +
  
 ===== Transposition en logique floue des réseaux de neurones récurrents de type GRU ===== ===== Transposition en logique floue des réseaux de neurones récurrents de type GRU =====
Line 83: Line 111:
  
  
-===== Etude de l'​algorithme du Deep Learning =====+===== Etude de l'​algorithme du Deep Learning ​et de l'​optimisation des architectures des ces réseaux de neurones ​=====
  
 Les réseaux de neurones multicouches sont redevenus très à la mode depuis que Google les utilise massivement pour le traitement automatique d'​images et de vidéos. Nous avons à IRIDIA étudié et réalisé plusieurs algorithmes d'​apprentissage de ces réseaux multicouches. Le mémoire consistera en une comparaison des algorithmes de deep learning tels ceux utilisés chez Google et les alternatives que nous proposons ici à IRIDIA depuis plusieurs années. Les réseaux de neurones multicouches sont redevenus très à la mode depuis que Google les utilise massivement pour le traitement automatique d'​images et de vidéos. Nous avons à IRIDIA étudié et réalisé plusieurs algorithmes d'​apprentissage de ces réseaux multicouches. Le mémoire consistera en une comparaison des algorithmes de deep learning tels ceux utilisés chez Google et les alternatives que nous proposons ici à IRIDIA depuis plusieurs années.
 +
 +Plus particulièrement,​ nous nous intéressons à des mécanismes automatiques d'​optimisation de l'​architecture de ces réseaux: Combien de couches, combien de filtres convolutifs par couche...
  
  * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​  * Contact : [[http://​code.ulb.ac.be/​iridia.people.php?​id=1|Hugues Bersini (IRIDIA)]] ​
Line 213: Line 243:
  
  
-===== Text Categorisation and quality control ​through ​automatic ​language processing ===== +===== Automated summaries of long or multiple texts through ​automated ​language processing =====
- +
-This thesis is developed in collaboration with the Energy Efficiency in Industrial Processes (EEIP) company. EEIP is a global industry information network. As part of their activities, they disseminate case studies to various network groups. The goal of the project is to develop an automatic language processing algorithm capable to evaluate the quality (accept / reject) of the proposed case studies and to allocate them to single/​multiple categories. Testing and training the algorithm is a key part as it not only requires development and testing of concepts such as how to evaluate quality or definition of requirements for multiple category allocation but the project also has +
-to be developed in a limited data environment (+/- 1000 case studies as training set). +
- +
-Required skills: A background in machine learning would be helpful.+
  
 +This thesis is developed in collaboration with the Energy Efficiency in Industrial Processes (EEIP) company. EEIP is a global industry information network. As part of their activities, they disseminate articles, reports and case studies to their global network of 150.000 business professionals. EEIP has already implemented an ALP algorithm (Bidirectional and Auto-Regressive Transformer (BART)) to summarize articles with a length of max. 1500 words. This solution is the result of a former thesis which was completed in 2021.
 + 
 +The main goal of this project is to develop an automatic language processing algorithm and process capable of summarizing long text (e.g. reports, 25-100 pages long) and multiple texts into a single summaries (e.g. 3 articles dealing with implementation of smart pump systems in industry).
 + 
 +Testing and training the algorithm is a key part, during the development (thesis-) phase but also after being in operation to improve the quality based on manual feedback via corrected summaries. A specific challenge is represented by the limited data environment (+/- 1000 case studies as training set), likely requiring using external test data sets during development.
 + 
 +A possible extension could be the pre-selection of external content (articles, case studies and reports) by analysing its relevance for EEIP based on fit with the thematic categories EEIP is using to represent the energy transition. This could be based on categorization capabilities of the new ALP algorithm or in conjunction with the algorithm used in EEIP’s recommendation engine.
  
   * Contacts :    * Contacts : 
     * [[http://​iridia.ulb.ac.be/​~stuetzle|Thomas Stützle (IRIDIA)]] ​     * [[http://​iridia.ulb.ac.be/​~stuetzle|Thomas Stützle (IRIDIA)]] ​
     * [[https://​www.ee-ip.org/​|Jürgen Ritzek (EE-IP)]] ​     * [[https://​www.ee-ip.org/​|Jürgen Ritzek (EE-IP)]] ​
- 
- 
- 
-===== Software framework for ant colony optimization ===== 
- 
-Ants have inspired a number of computational techniques and among the most successful is ant colony optimization (ACO). ACO is an optimization technique that can be applied to tackle a wide variety of computational problems that arise in computer science, telecommunications,​ and engineering. While ACO has a very wide applicability,​ the development times for effective ACO algorithms can be relatively high. This is due to the fact that each time a new problem is to be tackled by an ACO algorithm, a researcher needs to implement the algorithms almost from scratch. ​ 
- 
-The goal of the project is to provide a software framework to support the application and the implementation of ACO algorithms to new problems. The software framework will offer all the standard procedures that are used in ACO algorithms and will allow for the rapid prototyping of ACO algorithms. ​ 
-The application of this software framework will be tested on a number of optimization problems. 
- 
-Required skills: The candidate should be well acquainted with programming in object oriented languages. 
- 
- 
-  * Contacts :  
-    * [[http://​iridia.ulb.ac.be/​~mdorigo|Marco Dorigo (IRIDIA)]] ​ 
-    * [[http://​iridia.ulb.ac.be/​~stuetzle|Thomas Stützle (IRIDIA)]] ​ 
  
  
 
teaching/mfe/ia.1550488530.txt.gz · Last modified: 2019/02/18 12:15 by bersini