Artwork

เนื้อหาจัดทำโดย BlueDot Impact เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก BlueDot Impact หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal
Player FM - แอป Podcast
ออฟไลน์ด้วยแอป Player FM !

We Need a Science of Evals

20:12
 
แบ่งปัน
 

ซีรีส์ที่ถูกเก็บถาวร ("ฟีดที่ไม่ได้ใช้งาน" status)

When? This feed was archived on February 21, 2025 21:08 (1M ago). Last successful fetch was on January 02, 2025 12:05 (3M ago)

Why? ฟีดที่ไม่ได้ใช้งาน status. เซิร์ฟเวอร์ของเราไม่สามารถดึงฟีดพอดคาสท์ที่ใช้งานได้สักระยะหนึ่ง

What now? You might be able to find a more up-to-date version using the search function. This series will no longer be checked for updates. If you believe this to be in error, please check if the publisher's feed link below is valid and contact support to request the feed be restored or if you have any other concerns about this.

Manage episode 458945498 series 3498845
เนื้อหาจัดทำโดย BlueDot Impact เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก BlueDot Impact หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal

This lays out a number of open questions, in what the author calls a 'Science of Evals'.

Original text: https://www.apolloresearch.ai/blog/we-need-a-science-of-evals
Author(s): Apollo Research blog

A podcast by BlueDot Impact.
Learn more on the AI Safety Fundamentals website.

  continue reading

บท

1. We Need a Science of Evals (00:00:00)

2. What do we mean by “Science of Evals”? (00:04:58)

3. Maturation process of a field (00:06:41)

4. Current work in the direction of Science of Evals (00:10:23)

5. Next steps (00:14:01)

6. Field building (00:14:10)

7. Open research questions (00:16:11)

8. Conclusion (00:19:20)

85 ตอน

Artwork
iconแบ่งปัน
 

ซีรีส์ที่ถูกเก็บถาวร ("ฟีดที่ไม่ได้ใช้งาน" status)

When? This feed was archived on February 21, 2025 21:08 (1M ago). Last successful fetch was on January 02, 2025 12:05 (3M ago)

Why? ฟีดที่ไม่ได้ใช้งาน status. เซิร์ฟเวอร์ของเราไม่สามารถดึงฟีดพอดคาสท์ที่ใช้งานได้สักระยะหนึ่ง

What now? You might be able to find a more up-to-date version using the search function. This series will no longer be checked for updates. If you believe this to be in error, please check if the publisher's feed link below is valid and contact support to request the feed be restored or if you have any other concerns about this.

Manage episode 458945498 series 3498845
เนื้อหาจัดทำโดย BlueDot Impact เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก BlueDot Impact หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal

This lays out a number of open questions, in what the author calls a 'Science of Evals'.

Original text: https://www.apolloresearch.ai/blog/we-need-a-science-of-evals
Author(s): Apollo Research blog

A podcast by BlueDot Impact.
Learn more on the AI Safety Fundamentals website.

  continue reading

บท

1. We Need a Science of Evals (00:00:00)

2. What do we mean by “Science of Evals”? (00:04:58)

3. Maturation process of a field (00:06:41)

4. Current work in the direction of Science of Evals (00:10:23)

5. Next steps (00:14:01)

6. Field building (00:14:10)

7. Open research questions (00:16:11)

8. Conclusion (00:19:20)

85 ตอน

ทุกตอน

×
 
Loading …

ขอต้อนรับสู่ Player FM!

Player FM กำลังหาเว็บ

 

คู่มืออ้างอิงด่วน

ฟังรายการนี้ในขณะที่คุณสำรวจ
เล่น