Artwork

เนื้อหาจัดทำโดย Joe Carlsmith เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก Joe Carlsmith หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal
Player FM - แอป Podcast
ออฟไลน์ด้วยแอป Player FM !

Why focus on schemers in particular? (Sections 1.3-1.4 of "Scheming AIs")

31:17
 
แบ่งปัน
 

Manage episode 385590246 series 3402048
เนื้อหาจัดทำโดย Joe Carlsmith เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก Joe Carlsmith หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal
  continue reading

บท

1. Why focus on schemers in particular? (Sections 1.3-1.4 of "Scheming AIs") (00:00:00)

2. 1.3 Why focus on schemers in particular? (00:00:36)

3. 1.3.1 The type of misalignment I’m most worried about (00:01:14)

4. 1.3.2 Contrast with reward-on-the-episode seekers (00:04:27)

5. 1.3.2.1 Responsiveness to honest tests (00:04:46)

6. 1.3.2.2 Temporal scope and general “ambition” (00:07:54)

7. 1.3.2.3 Sandbagging and “early undermining” (00:11:17)

8. 1.3.3 Contrast with models that aren’t playing the training game (00:17:13)

9. 1.3.4 Non-schemers with schemer-like traits (00:23:13)

10. 1.3.5 Mixed models (00:25:20)

11. 1.4 Are theoretical arguments about this topic even useful? (00:28:35)

57 ตอน

Artwork
iconแบ่งปัน
 
Manage episode 385590246 series 3402048
เนื้อหาจัดทำโดย Joe Carlsmith เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก Joe Carlsmith หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal
  continue reading

บท

1. Why focus on schemers in particular? (Sections 1.3-1.4 of "Scheming AIs") (00:00:00)

2. 1.3 Why focus on schemers in particular? (00:00:36)

3. 1.3.1 The type of misalignment I’m most worried about (00:01:14)

4. 1.3.2 Contrast with reward-on-the-episode seekers (00:04:27)

5. 1.3.2.1 Responsiveness to honest tests (00:04:46)

6. 1.3.2.2 Temporal scope and general “ambition” (00:07:54)

7. 1.3.2.3 Sandbagging and “early undermining” (00:11:17)

8. 1.3.3 Contrast with models that aren’t playing the training game (00:17:13)

9. 1.3.4 Non-schemers with schemer-like traits (00:23:13)

10. 1.3.5 Mixed models (00:25:20)

11. 1.4 Are theoretical arguments about this topic even useful? (00:28:35)

57 ตอน

ทุกตอน

×
 
Loading …

ขอต้อนรับสู่ Player FM!

Player FM กำลังหาเว็บ

 

คู่มืออ้างอิงด่วน

ฟังรายการนี้ในขณะที่คุณสำรวจ
เล่น