# Anticor

Anticor recrute un ou une data scientist

Analyse de données pour la Détection d’Anomalies dans l’Attribution des Marchés Publics

Objectifs de la mission : le projet dans lequel s’inscrit cette offre de CDD vise à poursuivre le développement d’un prototype de détection d’anomalies dans l’attribution des marchés publics entamé il y a un an en utilisant des modèles statistiques et de traitement automatique du langage naturel (NLP, LLMs). Ce projet s’est appuyé sur une étude juridique préalable qui a caractérisé deux types d’anomalies : les prix manifestement supérieurs au marché et le recours excessif au même prestataire. Dans ce contexte, nous recherchons un candidat motivé dans les domaines de l’informatique ou de la science des données, intéressé par les modèles d’apprentissage statistique, le traitement du langage naturel et leurs applications à la détection d’anomalies dans l’attribution des marchés publics.

Les objectifs de ce projet sont les suivants :

  1. Achever un premier cycle de développement du prototype existant ;
  2. Evaluer plusieurs modèles statistiques pour identifier les anomalies liées aux prix dans les données d’attribution des marchés publics ;
  3. Intégrer et évaluer l’utilisation de plusieurs modèles de langue open- source et des techniques de NLP pour extraire et analyser des informations textuelles recherchées dans un corpus de documents liés aux marchés publics.
  4. Développer des algorithmes spécifiques pour détecter le recours excessif au même prestataire dans les données ;
  5. Tester et évaluer la performance du système de détection d’anomalies sur des cas d’utilisation réels.
  6. Documenter le processus de développement, les résultats obtenus et proposer des recommandations pour les améliorations futures.

Les étapes sont les suivantes :

  1. Participer à l’évaluation approfondie du prototype existant, des données disponibles et des résultats de l’étude juridique ;
  2. Compléter l’implémentation de modèles statistiques spécifiques pour détecter les anomalies de prix et de recours excessif au même prestataire ;
  3. Continuer l’intégration de modèles de langue et de techniques de NLP pour l’analyse textuelle et l’extraction d’informations clés ;
  4. Participer à la finalisation de la création du système intégré de détection d’anomalies prenant en charge les deux types d’anomalies étudiées.
  5. Effectuer une série de tests et évaluation approfondis du système sur des données réelles afin de mesurer sa précision et sa robustesse.
  6. Rédaction d’un rapport sur le travail réalisé, les résultats obtenus et participer à la proposition de perspectives d’amélioration du système.

Les responsabilités sont les suivantes :

  • Contribuer au développement et à l’amélioration d’un prototype existant pour la détection d’anomalies dans les marchés publics, en mettant l’accent sur les prix anormaux et le recours excessif au même prestataire ;
  • Implémenter des modèles statistiques avancés pour identifier et caractériser les anomalies détectées ;
  • Intégrer des techniques de traitement du langage naturel pour extraire et analyser des informations textuelles pertinentes à partir de documents liés aux marchés publics ;
  • Collaborer étroitement avec l’équipe pour tester, évaluer et améliorer les performances du système développé.
  • Documenter les travaux réalisés, y compris les choix techniques, les résultats obtenus et les recommandations pour l’amélioration continue du système.

Rémunération2.200 euros par mois

Amplitude de travail : 35h par semaine

Compétences requises :

  • Solides compétences en programmation (Python, etc.) et en manipulation de données (SQLite, langage de requêtes SQL, etc.) ;
  • Bonne compréhension des concepts de l’apprentissage automatique et de l’analyse statistique ;
  • Intérêt démontré pour le traitement du langage naturel et les modèles de langue, connaissance de vLLM et Ollama ainsi que des bibliothèque d’Huggingface sont souhaitables ;
  • Capacité à travailler de manière autonome tout en étant un membre efficace d’une équipe ;
  • Excellentes compétences en communication et capacité à présenter des résultats de manière claire et concise.

Conditions et Prise de Contact : les bureaux d’Anticor se trouvant au cœur de Paris, du fait de l’événement des Jeux Olympiques, il sera convenu que le travail s’effectuera en majorité en télétravail avec une série de réunions en présentiel à définir ensemble. Cette mission s’organisera de mi-Juillet à mi-Septembre avec deux semaines de pause en août. Le travail se fera sous la direction conjointe de Julien Perez, spécialiste de machine learning and data science et Emma Taillefer, professeure agrégée en économie-gestion et vice-présidente d’Anticor, avec la participation d’Elise Van Beneden, avocate, administratrice d’Anticor. Pour postuler à cette offre, merci de vérifier que vous avez les compétences requises et d’envoyer votre CV et une lettre de motivation à l’adresse suivante : datalab@anticor.org. Les candidatures seront examinées dès réception, et les candidats sélectionnés seront contactés pour une visio.

Partager cet article