DataOops : savoir-faire et compétences réunies autour des sujets données et DevOps. On y parle : - databases & performances : techniques d'optimisations, bonnes et mauvaises pratiques, détections des problèmes et même de hardware et de cloud - modélisations des données : les différents types de modélisation et leur spécificités. - devops : des bases du devops aux éléments les plus pointus et bien sur les liens entre les 3 domaines Retrouves nous sur https://www.dataoops.org pour plus de détails.
…
continue reading
1
Episode 57 : FastTransfer, DuckLake et quelques Oops
1:10:00
1:10:00
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:10:00Episode timelineโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
MongoDB vs PostgreSQL : différences et similarités.Démo d'Atlas SQL vs MQLMongoDB et l'IA : vecteur et searchโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
Episode timelineโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 54 : des nouvelles de DuckDB, des vecteurs chez les principales databases, no/low-code vs code
1:00:11
1:00:11
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:00:11Des nouvelles de DuckDB avec l'interface graphique DuckDB UI, Les vecteurs dans les principales bases de données relationnelles comme Oracle, SQL Server ou PostgreSQL et comment fabriquer ses embeddings. Enfin une discussion sur les avantages et inconvénients entre la solution NO/Low Code et le Code de l'intégration à la BI…
…
continue reading
1
Episode 53 : Bilan 2024 des databases / dbt & dlt un duo gagnants ?
51:00
51:00
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
51:00Episode timelineโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 52 : Iceberg et Delta, Migration de bases de données, Evidence.dev : Reports as Code
52:17
52:17
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
52:17Episode timelineโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 51 : DuckDB v1.1 vs PostgreSQL v17 / SQL en difficulté
1:04:10
1:04:10
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:04:10Episode timelineโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 45 : Chargement massif 1 Milliard de lignes dans un columnstore SQL Server en 6min, DuckDB v0.10, MS Fabrics et Vacuum
1:07:09
1:07:09
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:07:09Comment accélérer un chargement massif dans un columnstore sur SQL Server : un retour d'expérience approfondi avec 1 milliard de lignes chargé en 6 minutes.DuckDB passe en v0.10 et stabilise son stockage.MS Fabric annonce que le Vacuum sera bientot possible et voici pourquoi c'est une bonne chose...โดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 44 : REX dataoops modélisation et postgresql performance, DuckDB stars, MS Fabric ratio prix/performance
1:06:09
1:06:09
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:06:09REX sur des erreurs de modélisation avec des vues trop imbriquées, performance postgresql windows vs linux. DuckDB une star sur Github qui rejoint Postgresql. MS Fabric des prix d'appel pour les entreprises avec un ratio prix/performance attractif.โดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 43 : bilan 2023 une année spéciale pour la data avec l’émergence de l’IA et la progression des stockages objets et lakehouse
1:02:01
1:02:01
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:02:01Episode 43 : bilan 2023 avec les lakehouses, la gouvernance des données, les bases de données vectorielles, les IA génératives et autres LLM, Oracle Cloud et les bases Autonomousโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
Onyxia est une UX open source pour mettre en place un datalab avec des services basés sur des containers et orchestrés par K8s. Minio pour le stockage, Keycloak et Vault pour la sécurité s'intègre parfaitement.Cette solution est mise en oeuvre à l'INSEE avec le datalab SSP et Frederic Comte, Architecte Data à l'INSEE nous en explique les fondements…
…
continue reading
1
Episode 40 – Microsoft Fabric passe en GA
1:07:10
1:07:10
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:07:10Microsoft Fabric passe en GA : on en parleโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 39 : Interview Sylvain Lesage, Développeur chez Hugging Face
1:05:28
1:05:28
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:05:28Une interview de Sylvain Lesage développeur chez Hugging Face dans l'équipe en charge de la prévisualisation des datasets : le dataset viewer. Il nous parle de son parcours et de son expérience chez Hugging Face, une société très inspirée dans le monde de l'IA.โดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 38 : PowerBI et Couche Sémantique – Databases et Comptage Approximatif – Parquet méthode d’encodage
57:09
57:09
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
57:09Partie 1 : La couche sémantique et l'architecture de Power BI. Partie 2 : Comptage approximatif et l'algorythme hyperlolog. Partie 3 : les différents types d'encodage avec les columnstore index SQL Server & Apache Parquet et des stockages colonnaires en généralโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 37 : Oracle Data Cartbidge, SQL Server Minimal Logging, Parquet et tri des données, Database of Databases Dashboard, DataGouvernance
1:06:43
1:06:43
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:06:43Episode 37 : Oracle Database Data Cartbridge ou comment faire une extension dans la base Oracle. SQL Server Journalisation Minimale. L'importance du tri des données pour les performances avec Parquet. Le tableau de bord des bases de données : +900 databases étudiées. La DataGouvernance un sujet qui n'est pas uniquement technique.…
…
continue reading
1
Episode 36 : les tendances des bases de données / Une formation Databricks testée / DB Vectorielles : les points importants
1:08:06
1:08:06
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:08:06Databricks : formation en ligne gratuite et aparté Delta Lake 3.0.Oracle DB : un dashboard sur les features et innovation depuis la 11.2 avec 1608 features. Les tendances des bases de données (Relationnelles et NoSQL). Les bases de données vectorielles : qu'est ce qui les différencie et les points importants pour les choisir.…
…
continue reading
1
Episode 35 : SQL invulnérable / Microsoft DataFabric
1:03:10
1:03:10
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:03:10SQL : un language incontournable dans le traitement des données. On en parle avec une approche historique, les dialectes et les nouvelles approches qui rendent ce language plus vivant que jamais.Dans la deuxième partie de l'épisode on vous parle de Microsoft DataFabric : où en est-on avec ce nouveau service orienté données proposé par Microsoft.…
…
continue reading
1
Episode 34 : DataLakeHouse et architecture médaillon / Nouveautés d’Oracle Database 23c
1:00:34
1:00:34
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:00:34DataLakehouse et Architecture Médaillon.Les nouveautés d'Oracle Database 23cโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 33 : Bases de données vectorielles essai avec SQL Server + Microsoft Fabric Partie 2
1:07:26
1:07:26
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:07:26Dans cette épisode on parle d'un essai d'implémentation de recherche sémantique et vectorielle avec SQL Server. Dans la seconde partie : Approfondissement de Microsoft Fabric.โดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 32 : Avis sur Microsoft Fabric + Les bases de données vectorielles ou la mémoire des IAs
1:02:05
1:02:05
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:02:05Microsoft a lancé un nouveau service chapeau : Microsoft Fabric. Senser regrouper tous les services autour de l'analytique, ce service est plein de promesses. Premiers avis sur ce service avec Fabien Beaumont. Romain Ferraton aborde ensuite les bases de données vectorielles, support de la mémoire des IAs. Capables de recherches sémantiques accéléré…
…
continue reading
1
Episode 31 : REX dataoops SQL Server et IOT, Observabilité, DataMesh
1:39:00
1:39:00
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:39:004 sujets dans cet épisode :Une REX sur un problème de modélisation de données IOT dans SQL Server.L'arrivée des fonctionnalités spatiales sur DuckDB.Discussion sur l'observabilité : théorie et un exemple de log machine friendly avec Serilog.Discussion sur le datameshโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 30 : Parquet to SQL / 3 000 milliards de lignes dans SQL Server
1:08:10
1:08:10
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:08:10On parle de chargement de données Parquet dans SQL Server via C# et bulkcopy. On parle également des bonnes pratiques pour sql server pour stocker 3000 milliards de lignes. Dernière partie avec une overviewโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 29 : TPCH MSSQL entre dans la danse + ChatGpt Premiers tests
1:21:36
1:21:36
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:21:36TPCH : nouveaux tests avec SQL Server et influence de la collation sur les performances. Autres Tests TPCH SF100 : DuckDB & Hyper sur un laptop vs, Snowflake (XS to 4xLarge).Quelques mots sur nos premiers essais avec ChatGPTโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 28 : TPCH Cloud Databases vs DuckDB, les outils autour de Terraform et les extended events sur SQL Server.
1:40:07
1:40:07
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:40:07On parle un tout petit peu de chatGPT mais d'abord des évènements étendus (extended events) sur SQL Server et de leurs capacités à faire remonter des informations précieuses pour le diagnostique voir l'analyse du code.Ensuite nous abordons le benchmark TPCH et la comparaison des performances des bases Cloud comme comme Snowflake, BigQuery, SingleSt…
…
continue reading
1
Episode 26 : Big Data is Dead (DuckDB) / Data Gouvernance
1:17:52
1:17:52
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:17:52On discute de l'article Big Data is Dead : de Jordan Tigani.On discute des avantages de DuckDB.Puis un on aborde la data gouvernance avec Fabienโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 25 : DataLakeHouse, ADBC et Configuration VMWare pour les bases de données
1:16:13
1:16:13
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:16:131) Premières impression sur le DatalakeHouse de Databricks. 2) Le protocole ADBC (Arrow Database Connectivity) 3) Bonnes pratiques de configuration des VMs pour les bases de donnéesโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 23 : PowerBI External Tools
56:56
56:56
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
56:56Les external tools de powerBI permettent d'augmenter la productivité des développements. Fabien nous explique comment et quels tools choisirโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 22 : Datalake & Datasharing + DevOps & FinOps + Silicon Chalet
1:35:03
1:35:03
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:35:03Un tour d'horizon sur les solutions Datalake du marché et discussion sur le DatasharingCoté Devops : comme le devops est perçu suivant le type d'entrepriseFinOps : pilotage des coutsNews : Nouveau Meetup Silicon Chaletโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 21 : REX sur crash databases mssql + AWS AppRunner + les Certifications IT
1:31:52
1:31:52
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:31:52Episode 21 : Rex sur un crash d'une infrastructure virtuelle et l'impact sur les bases de données (MSSQL). Découverte de AWS App Runner et discussions sur les certifications ITโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 18 : DuckDB et Apache Arrow
58:56
58:56
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
58:56DuckDB est une base de données OLAP in-process et très légère : très utile pour la préparation de données en SQL Surtout quand cette base est compilée en C++, très performante, dotée de nombreuses fonctions, capable de lire et écrire des fichiers csv ou parquet et utilisable via ODBC,JDBC, API python ou C++ ou tout simplement via CLI.Apache Arrow e…
…
continue reading
1
Episode 15 : BigQuery un datawarehouse serverless sur GCP
1:08:50
1:08:50
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:08:50BigQuery : un datawarehouse serverless sur GCP tarifé à la requête. Brice Michetti, spécialiste GCP et BigQuery depuis plus de 5 ans nous en parleโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 12 : Datalake intro et aide pour les débutants dans le cloud
1:25:34
1:25:34
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:25:34On parle des bases d'un datalake et quelques conseils pour débuter ans le cloudโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 11 : Result Cache // FinOps & Ressources
1:03:58
1:03:58
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:03:58Le result cache (ou query cache) en base de données permet d'accélérer les requêtes répétitives et consommatrices sur les bases de données. Quelles databases disposent de cette fonctionnalité ?Optimiser sa consommation de ressources dans le cloud : le FinOpsโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 10 : DataHub & Strategie Data
1:07:33
1:07:33
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:07:33Datahub : définition(s) et approche. Data stratégie : comment mieux intégrer et gérer la données dans l'entrepriseโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 9 : Slowly Changing Dimensions // API
1:08:20
1:08:20
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:08:20Coté Modélisation : les SCD ou Slowly Changing dimensions (dimensions à évolution lente) ==> on discute des SCD1, SCD2, SCD3 et même SCD6.Eric nous parle API, REST bien sur !โดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 8 : Bases Graphes Neo4j // Parallélisme dans les databases relationnelles
1:16:18
1:16:18
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:16:18Bases de données graphes // Performance & Database : Le parallélismeโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 7 : Gestion des plans d’exécution (SPM) | Les étapes pour construire son datavault | Introduction à Terraform
1:51:55
1:51:55
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:51:553 parties dans cet épisode : la gestion des plans d'exécution particuliers dans les bases de données, les étapes pour concevoir son datavault et finalement une introduction a Terraformโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 5 : Clef en SHA256 (binary) ou BigInt ? // Indexation et InMemory
57:59
57:59
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
57:59Dans un datavault les clefs ne sont pas incrémentales, alors quelle technique utiliser : SHA256 ou fonction de hashache vers un entier ? Une partie sur l'indexation et l'ordre des colonnes, une autre sur le InMemory, la compression et le stockage colonne sur SQL Server, Oracle et HANA.โดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 4 : performance et Data Vault, Devops et Docker, Indexation dans les bases de données
1:27:14
1:27:14
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:27:14Modélisation : Data Vault la suite DevOps : Docker PerformanceIndexation dans les bases de donnéesโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 3 : Partitionnement, Data Vault et le CALMS du DevOps
1:20:18
1:20:18
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:20:18Performance Database : Partitionnement (Oracle & SQL Server) DevOps : Les fondements (CALMS) Modélisation DataVault: définition et utilitéโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 2 : Modélisation en étoile ou flocon, GitOps intro et performance sql des fonctions UDF
1:09:45
1:09:45
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
1:09:45Modélisation en étoile et en flocon : définition et utilité Gitops : principes et intérêts Performance Database : Fonctions Utilisateurs (UDF) dans les bases de données, cas d'utilisation et problèmes de performanceโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
1
Episode 1 : Modélisation en 3ème forme normale / Performance : Curseur vs ensembliste et sargable
48:17
48:17
เล่นในภายหลัง
เล่นในภายหลัง
ลิสต์
ถูกใจ
ที่ถูกใจแล้ว
48:17Modélisation et formes normales : définition et utilité Performance Database : Curseur vs Ensemble et notion de Sargableโดย Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading