Programmation d'un NanoGPT, encadrée par Julien Velcin, dans le cadre du premier semestre de M1 Informatique Lyon 2 pour l'UE de Initiation Recherche.
Le programme central est dans le fichier nanoGPTv3v2.py, et un exemple d'utilisation est donné dans le fichier mainNanoGPT.py.
On a plusieurs dossiers qui stockent différentes sortes de fichiers :
- Le dossier
sourcepermet de stocker les textes (.txt) qui servent à l'apprentissage des modèles. - Le dossier
saveStatpermet de stocker les fichiers.statqui servent à l'analyse - Le dossier
saveGPTpermet de stocker une sauvegarde des modèles, pour les utiliser plus tard
Ensuite, on a différents programmes que l'on peut utiliser après la création des modèles :
generationGPT.py: permet de générer du texte à partir de modèle.gptsauvegardé- Tout les programmes en
stats_***.pyqui permettent de faire une analyse des différents hyperparamètres
Pour que notre programme s'exécute correctement, nous avons besoin des packages suivants :
- os, sys, time, pickle
- numpy, matplotlib, scipy
- torch
- colorama
- wikipedia
Date : 01/2024