[Audio] Séquence I Grain 4 Persistance Et Efficacité INDUSTRIELLE Optimiser les Entrées/Sorties pour le pipeline haute performance. Hajar IBALINE | Doctorante Monitrice, ENSA Kénitra.
[Audio] Objectif Pédagogique Éviter les goulots Choisir le binaire Identifier pourquoi les formats textuels freinent Maîtriser les formats natifs pour une persistance vos pipelines. instantanée..
[Audio] PROBLÉMATIQUE Le poids du texte. PROBLÉMATIQUE Le poids du texte.
[Audio] textuel VS binaire Format Lisibilité Coût d'I/O CSV / J-S-O-N Humaine (Haute) Très élevé (Parsing) NPY / N-P-Z Machine (Nulle) Très faible (Direct) Pourquoi ? Le texte demande une conversion String vers Float coûteuse à chaque lecture..
[Audio] solution Sérialisation Haute Performance.
[Audio] DÉMONSTRATION technique L'atout majeur Le fichier binaire .npy est une copie conforme de votre R-A-M-. Aucun traitement n'est nécessaire pour le charger : il est injecté directement..
[Audio] LE CAS DU NP.SAVEZ_COMPRESSED Optimisation de l'espace : Réduit la taille sur disque pour les gros datasets. Compromis I/O : Temps C-P-U légèrement supérieur pour la décompression, mais gain en stockage..
[Audio] Conclusion Du Grain 4 CSV : À réserver uniquement à l'échange inter logiciels. Binaire (.npy) : Le standard industriel pour les pipelines de données..
[Audio] Quiz 1. Pourquoi éviter le C-S-V pour les datasets massifs ? 2. Quel est l'avantage principal du format '.npy' ? 3. Dans quel cas choisir 'np.savez_compressed' ?.