Artwork

เนื้อหาจัดทำโดย DataQubi เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก DataQubi หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal
Player FM - แอป Podcast
ออฟไลน์ด้วยแอป Player FM !

Optimal Chunking for RAG Retrieval: Why Semantic Integrity Matters

16:30
 
แบ่งปัน
 

Manage episode 510935275 series 3656088
เนื้อหาจัดทำโดย DataQubi เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก DataQubi หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal

Send us a text

A deep dive into RAG foundations, asserting that your system is only as good as your chunking strategy. Learn why using naive splits (e.g., every 500 characters) is a recipe for retrieval failure. We explore the critical shift to context-aware, semantic chunking, which focuses on preserving conceptual integrity- such as never splitting key facts like an "Employee of the Year Award" from the employee’s name. Implementing smart, semantic chunking, often with overlaps, is shown to skyrocket retrieval accuracy in enterprise applications from below 50% to 90%+.

Support the show

Thank you for tuning in to "Analyze Happy: Crafting Your Data Estate"!
We hope you enjoyed today’s deep dive. If you found this episode helpful, don’t forget to subscribe for more insights on building modern data estates with Microsoft technologies like Fabric, Azure Databricks, and Power Platform.

Connect with Us:

  • Have a question or topic you’d like us to cover? Reach out on linkedin.com/company/dataqubi or [email protected]
  • Visit our website at www.dataqubi.com or episode resources, show notes, and additional tips on data governance, AI transformation, and best practices.

Stay Ahead:
Check out the Microsoft Learn portal for free training on Azure IoT, Fabric, and more, or explore the Azure Databricks community for the latest updates. Let’s keep crafting data solutions that fit your organization’s culture and tech landscape—happy analyzing until next time!

  continue reading

32 ตอน

Artwork
iconแบ่งปัน
 
Manage episode 510935275 series 3656088
เนื้อหาจัดทำโดย DataQubi เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก DataQubi หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal

Send us a text

A deep dive into RAG foundations, asserting that your system is only as good as your chunking strategy. Learn why using naive splits (e.g., every 500 characters) is a recipe for retrieval failure. We explore the critical shift to context-aware, semantic chunking, which focuses on preserving conceptual integrity- such as never splitting key facts like an "Employee of the Year Award" from the employee’s name. Implementing smart, semantic chunking, often with overlaps, is shown to skyrocket retrieval accuracy in enterprise applications from below 50% to 90%+.

Support the show

Thank you for tuning in to "Analyze Happy: Crafting Your Data Estate"!
We hope you enjoyed today’s deep dive. If you found this episode helpful, don’t forget to subscribe for more insights on building modern data estates with Microsoft technologies like Fabric, Azure Databricks, and Power Platform.

Connect with Us:

  • Have a question or topic you’d like us to cover? Reach out on linkedin.com/company/dataqubi or [email protected]
  • Visit our website at www.dataqubi.com or episode resources, show notes, and additional tips on data governance, AI transformation, and best practices.

Stay Ahead:
Check out the Microsoft Learn portal for free training on Azure IoT, Fabric, and more, or explore the Azure Databricks community for the latest updates. Let’s keep crafting data solutions that fit your organization’s culture and tech landscape—happy analyzing until next time!

  continue reading

32 ตอน

ทุกตอน

×
 
Loading …

ขอต้อนรับสู่ Player FM!

Player FM กำลังหาเว็บ

 

คู่มืออ้างอิงด่วน

ฟังรายการนี้ในขณะที่คุณสำรวจ
เล่น