Réunion du 26.07.2022

Participants : Victoire Houyau Pedascoll et Dounia Lakhmiri

Descriptif : Classificateur real-time pour décider l'activation de VNS

Ordre du jour :

  1. Données :
    • Trouver un maximum de features cohérentes (nombre d'échecs successifs, mesh index, mesh size, succès, etc.), le label est l'activation ou non de VNS.
    • Synchroniser les données par ligne –> faire attention à ce que l'information du succès ou de l'échec soit associé à la bonne mégaitération
    • Formatage de données à uniformiser pour qu'il se généralise à tous les problèmes : on ne peut pas gérer un mesh index par variable parce que c'est dépendant de la dimension –> utiliser la moyenne et/ou variance ?
  2. Entraînement :
    • Entraînement sur des données post optimisation pour créer un model en sélectionnant sur les mégaitérations (=ligne) avec succès.
    • Model sur un maximum de données standardisées (non problem-dependent) –> utilisation du Runner serait bien
    • K-split cross-validation pour éviter l'overfitting –> à trouver dans sklearn
  3. Gestion dans NOMAD :
    • Analyse par traitement de fichiers externes : récupération des données dans un fichier texte (ou csv pour l'instant)
    • Prédiction à partir du model déjà entraîné : python ? fichier texte avec les poids ?
  4. Pour le futur :
    • Création d'un model par classe de problème (constrained/unconstrained, smooth/unsmooth, noise, etc.)
    • Ajustement des poids en real-time quand assez de mégaitération : stopper run nomad et rentraîner le model