Persistance et Efficacité Industrielle

Published on
Embed video
Share video
Ask about this video

Scene 1 (0s)

[Audio] Séquence I Grain 4 Persistance Et Efficacité INDUSTRIELLE Optimiser les Entrées/Sorties pour le pipeline haute performance. Hajar IBALINE | Doctorante Monitrice, ENSA Kénitra.

Scene 2 (12s)

[Audio] Objectif Pédagogique Éviter les goulots Choisir le binaire Identifier pourquoi les formats textuels freinent Maîtriser les formats natifs pour une persistance vos pipelines. instantanée..

Scene 3 (22s)

[Audio] PROBLÉMATIQUE Le poids du texte. PROBLÉMATIQUE Le poids du texte.

Scene 4 (28s)

[Audio] textuel VS binaire Format Lisibilité Coût d'I/O CSV / J-S-O-N Humaine (Haute) Très élevé (Parsing) NPY / N-P-Z Machine (Nulle) Très faible (Direct) Pourquoi ? Le texte demande une conversion String vers Float coûteuse à chaque lecture..

Scene 5 (49s)

[Audio] solution Sérialisation Haute Performance.

Scene 6 (55s)

[Audio] DÉMONSTRATION technique L'atout majeur Le fichier binaire .npy est une copie conforme de votre R-A-M-. Aucun traitement n'est nécessaire pour le charger : il est injecté directement..

Scene 7 (1m 9s)

[Audio] LE CAS DU NP.SAVEZ_COMPRESSED Optimisation de l'espace : Réduit la taille sur disque pour les gros datasets. Compromis I/O : Temps C-P-U légèrement supérieur pour la décompression, mais gain en stockage..

Scene 8 (1m 23s)

[Audio] Conclusion Du Grain 4 CSV : À réserver uniquement à l'échange inter logiciels. Binaire (.npy) : Le standard industriel pour les pipelines de données..

Scene 9 (1m 35s)

[Audio] Quiz 1. Pourquoi éviter le C-S-V pour les datasets massifs ? 2. Quel est l'avantage principal du format '.npy' ? 3. Dans quel cas choisir 'np.savez_compressed' ?.