Réunion du 26.07.2022
Participants : Victoire Houyau Pedascoll et Dounia Lakhmiri
Descriptif : Classificateur real-time pour décider l'activation de VNS
Ordre du jour :
- Données :
- Trouver un maximum de features cohérentes (nombre d'échecs successifs, mesh index, mesh size, succès, etc.), le label est l'activation ou non de VNS.
- Synchroniser les données par ligne –> faire attention à ce que l'information du succès ou de l'échec soit associé à la bonne mégaitération
- Formatage de données à uniformiser pour qu'il se généralise à tous les problèmes : on ne peut pas gérer un mesh index par variable parce que c'est dépendant de la dimension –> utiliser la moyenne et/ou variance ?
- Entraînement :
- Entraînement sur des données post optimisation pour créer un model en sélectionnant sur les mégaitérations (=ligne) avec succès.
- Model sur un maximum de données standardisées (non problem-dependent) –> utilisation du Runner serait bien
- K-split cross-validation pour éviter l'overfitting –> à trouver dans sklearn
- Gestion dans NOMAD :
- Analyse par traitement de fichiers externes : récupération des données dans un fichier texte (ou csv pour l'instant)
- Prédiction à partir du model déjà entraîné : python ? fichier texte avec les poids ?
- Pour le futur :
- Création d'un model par classe de problème (constrained/unconstrained, smooth/unsmooth, noise, etc.)
- Ajustement des poids en real-time quand assez de mégaitération : stopper run nomad et rentraîner le model