AI, policy, and the weird sci-fi future with Anthropic’s Jack Clark

Jack Clark, đồng sáng lập Anthropic, có hành trình sự nghiệp độc đáo từ nhà báo công nghệ chuyên sâu đến chuyên gia chính sách AI, nhận thức sớm về tầm quan trọng của AI và tác động của nó.
Chính phủ Vương quốc Anh, đặc biệt là Đảng Lao động, coi AI là động lực kinh tế then chốt, đồng thời kế thừa và tìm cách khai thác Viện An toàn AI (AISI) để bảo vệ công chúng khỏi các rủi ro hữu hình.
AI không chỉ là công cụ mà là "những quốc gia silicon" hoặc "linh hồn máy móc" với giá trị và trực giác nội tại, đòi hỏi cách tiếp cận toàn diện như đối phó với "các quốc gia ngoài vòng pháp luật" và cần được thấu hiểu thông qua khả năng diễn giải cơ học, đặc biệt do tốc độ tư duy vượt trội của máy.

Tiến hóa vai trò chuyên gia AI: Jack Clark là ví dụ về sự chuyển đổi từ việc đưa tin về công nghệ AI (phóng viên mạng thần kinh) sang xây dựng và định hình chính sách AI, nhấn mạnh tầm quan trọng của việc hiểu sâu sắc công nghệ.
Chiến lược AI của Chính phủ UK: Đảng Lao động ưu tiên AI như một công cụ then chốt để thúc đẩy tăng trưởng kinh tế, đồng thời tận dụng tài sản quốc gia như Viện An toàn AI (AISI) để giải quyết các rủi ro an toàn cấp độ "tính mạng và sức khỏe."
Giá trị hiện tại của AI: Ngay cả với các mô hình AI hiện có mà không cần các bước nhảy vọt theo định luật mở rộng quy mô, vẫn còn tiềm năng kinh tế và xã hội to lớn chưa được khai thác, chủ yếu thông qua việc tối ưu hóa các quy trình "back-office" và bộ máy quan liêu.
AI như một đối tượng phức tạp: Các mô hình AI vượt xa khái niệm "công cụ đơn giản" hay "vẹt ngẫu nhiên"; chúng được mô tả là "những tấm gương sáng tạo" hoặc "linh hồn máy móc" với trực giác và giá trị nội tại, phản ánh văn hóa mà chúng được đào tạo.
Khung chính sách "Quốc gia ngoài vòng pháp luật của AI": Jack Clark đề xuất coi các hệ thống AI như những "quốc gia" đang hình thành, đặc biệt là các hệ thống AI bị sai lệch mục tiêu như "quốc gia ngoài vòng pháp luật," để thúc đẩy cách tiếp cận chính sách toàn diện cấp chính phủ thay vì từng bộ phận riêng lẻ.
Thách thức của khả năng diễn giải AI: Các hệ thống AI có tính "khó hiểu" (opaque), tương tự như việc cố gắng hiểu một "quốc gia khó hiểu" như Triều Tiên, đòi hỏi nghiên cứu chuyên sâu về khả năng diễn giải cơ học (mechanical interpretability) để xây dựng niềm tin và kiểm soát.
Mối đe dọa từ "Thời gian máy": Mô hình rủi ro lớn nhất từ AI xuất phát từ sự khác biệt tốc độ suy nghĩ giữa con người và máy móc; AI tương lai có khả năng xử lý thông tin và tư duy nhanh hơn con người rất nhiều lần, tạo ra một mối đe dọa tiềm ẩn đáng kể.

AI (Artificial Intelligence) — Trí tuệ nhân tạo
AI Safety Institute (AISI) — Viện An toàn AI
Scaling laws — Định luật mở rộng quy mô
Stochastic parrots — Những con vẹt ngẫu nhiên
Creative mirrors — Những tấm gương sáng tạo
Rogue states — Các quốc gia "ngoài vòng pháp luật" (trong bối cảnh AI)
Mechanical interpretability — Khả năng diễn giải cơ học
Large Language Model (LLM) — Mô hình ngôn ngữ lớn
Machine time — Thời gian máy
Threat model — Mô hình đe dọa

Jack Clark và Hành Trình đến với AI

Chào mừng bạn đến với một cuộc trò chuyện khác từ Anthropic. Tôi là Stuart Ritchie. Công việc của tôi là trao đổi với các nhà nghiên cứu và nhân viên khác của chúng tôi về những suy nghĩ của họ về AI. Hôm nay, tôi có mặt ở đây cùng Jack Clark, một trong những người đồng sáng lập và là trưởng bộ phận chính sách của chúng tôi. Bạn có thể biết đến anh ấy qua bản tin của mình, Import AI, một bản tóm tắt hàng tuần rất hữu ích và mang tính quan điểm về những gì đã và đang xảy ra trong AI. Cảm ơn Jack rất nhiều vì đã tham gia. Trước khi bắt đầu, anh có thể chia sẻ một chút về lý lịch của mình và cách anh đã đạt được vị trí hiện tại không?

Vâng, tôi có một lý lịch khá lạ và tôi đã đi một con đường rất quanh co để đến được đây. Tôi bắt đầu sự nghiệp với tư cách là một nhà báo kỹ thuật và tôi coi nghề báo giống như diễn xuất phương pháp vậy. Vì vậy, bất cứ điều gì tôi viết, tôi đều cố gắng hiểu rõ. Khi viết về cơ sở dữ liệu, tôi tự học SQL; khi viết về chip máy tính, tôi tìm hiểu về sản xuất chất bán dẫn. Tuyệt vời. Đến một lúc nào đó, tôi trở nên bị ám ảnh bởi các trung tâm dữ liệu và tôi bắt đầu một loạt bài mang tên "Mặt tối đám mây của Clark". Tôi thường đi tham quan các trung tâm dữ liệu khắp châu Âu và phần còn lại của thế giới và thực sự đắm mình vào nó. Tôi nhớ vào khoảng năm 2010, tôi nhận ra rằng một công ty như Google sẽ sử dụng học máy trên tất cả các trung tâm dữ liệu này; họ đã xây dựng tất cả những máy tính này và sẽ làm gì đó với chúng. Vì vậy, tôi chuyển đến Mỹ để đưa tin về lĩnh vực Trí tuệ nhân tạo (AI) còn rất non trẻ vào thời điểm đó, tự gọi mình là phóng viên mạng thần kinh duy nhất trên thế giới, điều này khá dễ dàng vào năm 2012. Sau đó, tôi gia nhập OpenAI vào năm 2016 và rất nhanh chóng bị ám ảnh bởi chính sách vì tôi nhận ra tầm quan trọng của nó và việc những người làm chính sách biết rất ít về nó, và tôi đã làm việc trong lĩnh vực đó kể từ đó.

Quan Điểm của Chính phủ Vương quốc Anh về AI

Và bây giờ anh là trưởng bộ phận chính sách như tôi đã đề cập, chúng ta đang ở London hôm nay. Hôm qua anh đã tham dự hội nghị của Đảng Lao động (Labour Party), dành cho những người quốc tế. Đảng Lao động hiện là đảng cầm quyền của Vương quốc Anh và anh đã phát biểu tại hội nghị của họ. Họ vừa lên nắm quyền. Chắc chắn có hàng triệu người đang nói với họ rằng đây là ưu tiên, đây là ưu tiên, đây là ưu tiên. Anh biết đấy, họ có một sự kiện về AI. Rõ ràng là họ đang suy nghĩ về AI ở một mức độ nào đó. Ấn tượng của anh về cách họ suy nghĩ về AI là gì, và họ quan tâm đến vấn đề này ở mức độ nào?

Vâng, điều thực sự nổi bật là họ liên tục nhắc đến AI trong nhóm các công nghệ hoặc những thứ sẽ giúp phát triển nền kinh tế Anh. Vì vậy, Đảng Lao động, như những người ở đây biết, khá bị ám ảnh với việc làm thế nào để đưa Anh phát triển trở lại và họ đã xác định AI là một trong những điều then chốt cần làm. Họ cũng kế thừa Viện An toàn AI (AI Safety Institute), được thành lập bởi chính phủ Bảo thủ và là một tài sản quốc gia. Anthropic đã thực hiện thử nghiệm trước triển khai với AISI. Vì vậy, điều khiến tôi ấn tượng là chính phủ Vương quốc Anh hiện đang suy nghĩ về cách xây dựng dựa trên di sản của những người tiền nhiệm chính trị của mình, điều này không bình thường. Thông thường, bạn muốn đến và phá bỏ tất cả những thứ này. Họ thực sự nhận thức được giá trị của AISI và đang cố gắng suy nghĩ về cách khai thác nhiều hơn từ nó.

Và tôi có thể làm rõ rằng Viện An toàn AI (AI Safety Institute), viết tắt là AISI, được phát âm là AC, khác với viện ở Hoa Kỳ được gọi là AC ở Washington, hay AC của US AC, hay AC/DC? Vâng, tôi đang dẫn anh đến tên gọi không chính thức đó. Anh biết đấy, không có cơ quan chính phủ Hoa Kỳ nào đã phê duyệt. Vâng, chính xác. Vì vậy, Thủ tướng tiền nhiệm của chúng ta, Rishi Sunak, đã nói rất nhiều về an toàn AI. Đó là một trong những trọng tâm lớn của ông ấy. Đảng Lao động đã kế thừa Viện An toàn AI. Vậy họ lo lắng về an toàn AI ở mức độ nào so với việc coi AI là một công cụ để giúp phát triển nền kinh tế? Trong các cuộc trò chuyện của tôi, họ quan tâm đến an toàn AI ở mức độ họ quan tâm đến việc bảo vệ công chúng khỏi những thứ có thể gây hại đến "tính mạng và sức khỏe" – một cụm từ được một trong các Nghị sĩ mà tôi đã nói chuyện sử dụng. Vì vậy, về mặt này, họ sẽ tương tự như chính phủ Hoa Kỳ và các nước khác, những người tập trung vào các rủi ro thảm khốc như sinh học hoặc không gian mạng. Nhưng ngoài ra, cảm nhận chung của tôi là họ muốn giải quyết một số khía cạnh của an toàn nhưng cũng chỉ nghĩ về cách tận dụng AI và làm thế nào để chính phủ Anh hoạt động tốt hơn bằng cách sử dụng công nghệ AI nữa.

Và anh có nghĩ rằng họ đang suy nghĩ về các rủi ro an toàn theo cách mà chúng ta có thể nghĩ về rủi ro của mạng xã hội hoặc các công nghệ khác đã xuất hiện trước đây, thay vì những loại rủi ro mới lạ và có khả năng đáng sợ hơn nhiều mà chúng ta thường nói đến khi đề cập đến AI không? Vâng, ý tôi là, họ mới nhậm chức được hai tháng. Tôi nghĩ sẽ có một khoảng thời gian giáo dục ngay bây giờ. Tôi nghĩ họ đang bị tràn ngập thông tin về vấn đề này và tôi đã không chọn ngày hôm qua để "mở chiếc vali" về tất cả những điều đáng sợ nhất mà chúng ta có thể tưởng tượng. Tôi chủ yếu nói về cách đảm bảo rằng AC (Viện An toàn AI) tiếp tục hoạt động tốt vì chúng tôi nghĩ rằng điều đó cuối cùng là hữu ích cho sự an toàn. Và sau đó chúng ta sẽ đi sâu vào một số rủi ro kỳ lạ hơn ngoài kia. Phải. Phải. Hợp lý.

AI: Động Lực Phát Triển Kinh Tế

Khi nói đến khía cạnh kinh tế, như anh đã nói, Đảng Lao động đã liên tục nói về tăng trưởng kể từ khi họ được bầu. Chúng ta đang thấy những bài viết nói về nền tảng của nền kinh tế Vương quốc Anh cần những sửa chữa cơ bản. Anh có coi AI là một phần lớn trong đó không? Ý tôi là, hình dung về việc AI có thể giúp thúc đẩy nền kinh tế Vương quốc Anh và các nền kinh tế khác như thế nào?

Vâng, anh biết đấy, khi chúng ta triển khai các hệ thống AI ngày nay, một trong những điều chính chúng ta thấy là các doanh nghiệp có rất nhiều "hệ thống ống nước giấy tờ" bên trong chúng. Hầu hết các doanh nghiệp thực chất là tập hợp các quy trình làm việc giúp bạn chuyển từ việc khách hàng nói chuyện với bạn đến một hành động nào đó như bán cho họ một thứ gì đó hoặc giải quyết một khiếu nại, và rất nhiều nơi mà các mô hình ngôn ngữ và các hệ thống mạnh mẽ này đang được sử dụng là trong cái "chất keo" nội bộ của một doanh nghiệp. Chính phủ là những bộ máy quan liêu khổng lồ đầy giấy tờ. Vì vậy, tôi nghĩ rằng thực ra điều mà mọi người hào hứng nhất là các khía cạnh back-office (văn phòng hỗ trợ). Làm thế nào để chúng ta làm cho những thứ như giấy tờ được tạo ra trong NHS (Cơ quan Dịch vụ Y tế Quốc gia) chảy qua hệ thống hiệu quả hơn? Làm thế nào để chúng ta xử lý các phản hồi cử tri cho các Nghị sĩ những người bị tràn ngập với nhu cầu của cử tri của họ và cần một hệ thống tốt hơn để lọc và phân tích chúng. Và nói chung, AI nắm giữ lời hứa về việc tiếp nhận một lượng lớn những thứ xung quanh chúng ta và biến nó thành thứ mà chúng ta thực sự có thể xử lý một cách thích hợp với tư cách là con người và chú ý đúng mức bằng cách sử dụng các hệ thống tạo sinh này để đọc, phân loại và hiểu "núi giấy tờ" xung quanh chúng ta.

Anh đã nói rằng, và điều này thực sự gây ấn tượng với tôi khi anh đưa ra quan điểm này, rằng ngay cả khi chúng ta không đạt được những tiến bộ về AI mà chúng ta thường nói đến như định luật mở rộng quy mô (scaling laws), các mô hình trở nên thông minh hơn theo thời gian, chúng ta vẫn sẽ tìm thấy những lợi ích kinh tế đáng kể và có thể cả những lợi ích xã hội khác trong các mô hình AI mà chúng ta hiện có. Vì vậy, ngay cả khi bằng cách nào đó chính phủ cấm chúng ta tạo ra thế hệ mô hình AI tiếp theo, chúng ta vẫn sẽ nhận được giá trị từ nó. Anh suy nghĩ về điều đó như thế nào?

Tôi nghĩ về nó giống như việc chúng ta vừa khám phá ra điện và đã lắp những bóng đèn đầu tiên trong các nhà máy, và bạn có thể dừng tất cả việc tinh chỉnh hiệu suất điện từ đó và chỉ có thứ mới mẻ cơ bản này. Và sau đó bạn vẫn sẽ xây dựng các nhà máy dựa trên giả định điện có sẵn, vì vậy thay vì treo bóng đèn trong đó, bạn sẽ xây dựng dây chuyền sản xuất dựa trên giả định họ có quyền truy cập vào thứ gì đó như điện hoặc tương tự. Vì vậy, AI vẫn còn một chặng đường dài để tích hợp vào nền kinh tế và xây dựng các doanh nghiệp mới và thú vị. Và nếu chúng ta dừng mọi thứ ngày hôm nay, một thiếu niên nào đó ở đâu đó sẽ tìm ra một cách sử dụng cực kỳ đột phá cho Claude hoặc bất kỳ hệ thống nào khác mà chúng ta chưa bao giờ dự đoán được, và sẽ có hàng chục đến hàng trăm những điều như vậy trong tương lai của chúng ta. Phải, vâng, chúng ta có tất cả những nhà phát triển đang làm việc để sử dụng Claude và đưa ra tất cả những ý tưởng tuyệt vời này. Vâng, điều đó có lý.

AI: Hơn Cả Một Công Cụ Đơn Thuần

Nhưng tất nhiên, nó không dừng lại. Theo như tôi biết, không có dấu hiệu nào cho thấy điều này đang dừng lại hoặc thậm chí chậm lại. Và tất nhiên, nhiều người nói về AI như thể chúng chỉ là "những con vẹt ngẫu nhiên" (stochastic parrots), chúng chỉ lặp lại những điều mà chúng đã học trước đó nhưng theo một cách ngẫu nhiên lộn xộn hoặc chỉ là những "bộ dự đoán token tiếp theo" trơ ì. Không có gì thú vị đang diễn ra ở đó. Nhưng một trong những điều mà anh nói khá nhiều trong bản tin của mình và ở những nơi khác là những thứ này còn hơn thế nữa. Những mô hình này còn hơn thế nữa. Tôi sẽ đọc một trích dẫn từ blog của anh vài tuần trước rằng AI là "creative mirrors" (tạm dịch: những tấm gương sáng tạo), "machine spirits" (linh hồn máy móc) của "human unconscious values" (những giá trị tiềm thức của con người), "simulacras" (những bản mô phỏng). Chúng ta không xử lý máy tính bỏ túi ở đây. Chúng ta không xử lý công cụ đơn giản. Chúng ta đang xử lý những sản phẩm/vật phẩm đa chiều rộng lớn mã hóa trong chính chúng, văn hóa mà chúng được đào tạo và có thể phản ánh văn hóa này trở lại. Anh có thể nói một chút về điều đó, anh biết đấy, nó có thể nghe khá nhàm chán. Nó có thể nghe như một phần mềm bán hàng mới đang nói về cách nó có thể thúc đẩy nền kinh tế. Nhưng khi anh đặt nó vào các thuật ngữ mà tôi vừa sử dụng, nó còn lớn hơn thế rất nhiều.

Vâng, ý tôi là, một cái búa không có bất kỳ bản năng nào về việc nó muốn đóng đinh nào. Và các hệ thống AI mà chúng ta đã xây dựng có một loại trực giác nhân tạo. Và điều đó thực sự đáng sợ và kỳ lạ. Chúng ta chưa bao giờ thực sự xây dựng những công cụ trước đây mà hiểu một điều gì đó giống như thế giới con người và có một số bản năng được thừa hưởng từ nó. Vì vậy, các hệ thống AI này, chúng có giá trị bên trong chúng. Chúng có một mức độ sáng tạo nào đó. Và khi chúng ta nhìn vào các loại mô hình mà chúng khám phá hoặc các thông tin chi tiết (Insights) mà chúng có. Chúng thể hiện điều mà nhiều, nhiều, nhiều người hợp lý sẽ mô tả là sáng tạo hoặc trực giác. Đôi khi nó không được tốt lắm. Nhưng chúng ta vẫn có một cái búa đang sáng tạo, điều này thật điên rồ và là một điều rất, rất bất thường. Và vì vậy, khuôn khổ mà tôi đang cố gắng dùng để nói chuyện với các nhà hoạch định chính sách là đây không phải là một công nghệ. Điều này còn hơn thế nữa, và tôi đã nói điều này với Hội đồng Bảo an Liên Hợp Quốc vào năm ngoái và tôi đã mở rộng ý tưởng này gần đây. Nó giống như chúng ta đã tìm ra cách để mô phỏng một khía cạnh nào đó của con người và mở rộng một khía cạnh nào đó về cách các quốc gia hoạt động. Và các hệ thống AI này giống như những quốc gia silicon này mà chúng ta đang nhập khẩu vào thế giới với tất cả những khả năng đáng kinh ngạc này. Và điều đó chưa từng xảy ra trước đây.

Hãy bám vào ẩn dụ các quốc gia silicon đó vì anh có một cách nghĩ về AI như là lý thuyết nhà nước bất hảo của AI. Và điều này vượt ra ngoài tác động ở một quốc gia cụ thể. Và đó là cách nghĩ về cách AI sẽ hoạt động trên thế giới và cách các chính phủ nên suy nghĩ về AI. Anh có thể giải thích cho chúng tôi về lý thuyết nhà nước bất hảo của AI không?

Và ý tưởng này tôi đã nói chuyện với các chính phủ về AI trong một thời gian dài. Và tôi thấy mình trong những cuộc trò chuyện khác nhau, đầu tiên về xe tự lái, sau đó về khả năng thị giác máy tính, rồi về ý nghĩa của AlphaGo hay các hệ thống học tăng cường và bây giờ là các mô hình ngôn ngữ. Và nếu bạn nhìn xung quanh thế giới trong suốt thời gian đó, không phải các công nghệ cá nhân là quan trọng. Mà là sự xuất hiện của loại hình điện toán quy mô tiện ích này mới là quan trọng. Và đó cũng là sự nổi lên của các hệ thống mới mà mọi người cần phải nghiên cứu và đánh giá một cách toàn diện hơn rất nhiều so với một bộ phận riêng lẻ của chính phủ.

So sánh AI với Quốc gia

Bạn nên coi các hệ thống AI như những quốc gia đang hình thành trên thế giới, và các hệ thống AI bị sai lệch mục tiêu như những quốc gia "ngoài vòng pháp luật" (rogue states). Lý do mà phép so sánh này hữu ích là khi bạn nói chuyện với các chính phủ về vấn đề an toàn, bạn có thể nói về vũ khí sinh học, rủi ro an ninh mạng, hoặc lừa đảo phishing. Tất cả những vấn đề đó đều có các bộ phận khác nhau của chính phủ được thiết lập để ứng phó. Nhưng nếu bạn nói với chính phủ rằng các hệ thống AI giống như một quốc gia mới đang làm những điều tồi tệ mà bạn không hiểu, điều đó đòi hỏi họ phải suy nghĩ một cách toàn diện hơn về cách họ giải quyết vấn đề đó. Và điều đó có nghĩa là bạn có thể nói với họ rằng, 'Cần có sự phản ứng của toàn bộ chính phủ đối với các hệ thống AI,' điều này thực sự nghe có vẻ hợp lý hơn nhiều nếu bạn coi nó như một quốc gia thay vì một công nghệ.

Khả năng Diễn giải Cơ học và Sự Độc đoán của AI

Và cũng có những phép so sánh khác. Chúng tôi dành nhiều thời gian tại Anthropic để nghiên cứu về khả năng diễn giải cơ học (interpretability). Chúng tôi đang cố gắng đi sâu vào các mô hình AI và tìm hiểu cách chúng hoạt động, bởi vì thực tế không ai biết chúng hoạt động như thế nào. Không ai có thể nói chính xác lý do tại sao Claude hoặc GPT (đối với bất kỳ mô hình AI nào trong số này) lại đưa ra phản hồi như vậy. Và có một sự tương đồng ở đây, đó là tội phạm học, phải không? Nó giống như việc cố gắng đoán xem điều gì đang xảy ra bên trong và tìm cách đạt được một mức độ dự đoán nào đó, tôi đoán vậy. Đúng vậy. Tương tự như cách nhóm khả năng diễn giải cơ học của chúng tôi đang cố gắng tìm hiểu xem Mô hình ngôn ngữ lớn (LLM) hoạt động như thế nào? Các hệ thống mà Mô hình ngôn ngữ lớn đưa ra quyết định là gì? Làm thế nào chúng ta có thể đưa thông tin đầu vào vào một Mô hình ngôn ngữ lớn và xem xét tất cả các quá trình xử lý nội bộ diễn ra, rồi nhìn vào kết quả đầu ra? Chà, CIA cũng làm điều tương tự đối với Triều Tiên, phải không? Theo một nghĩa nào đó, chúng ta đang vật lộn với một loại vấn đề tương tự: các hệ thống AI rất khó hiểu (opaque).

Và chúng ta khao khát muốn hiểu chúng bởi vì chúng có giá trị to lớn và cả một số rủi ro tiềm ẩn. Một số quốc gia khó hiểu (opaque), và bạn dành nhiều thời gian để tìm hiểu về chúng và tiềm năng rủi ro của chúng; các quốc gia "ngoài vòng pháp luật" (rogue states) cũng khó hiểu và là một rủi ro. Và thực tế chúng ta phản ứng với những điều này theo những cách tương tự. Ý tôi là, tôi tự hỏi phép so sánh đó nên mang lại cho chúng ta sự tự tin đến mức nào, bởi vì tôi không thể nghĩ ra nhiều quốc gia mà chúng ta coi là quốc gia ngoài vòng pháp luật (rogue states) mà hiện đã hoàn toàn căn chỉnh (aligned), phải không? Có thể một số ít quốc gia từng được coi là quốc gia ngoài vòng pháp luật (rogue states) thì nay vẫn đang mạnh mẽ là quốc gia ngoài vòng pháp luật. Tôi không chắc cộng đồng quốc tế đã làm tốt đến mức nào trong việc đưa họ trở lại quỹ đạo. Chà, bạn biết đấy, chúng ta đã chứng kiến sự tan rã của Nga vào cuối Chiến tranh Lạnh và nhiều quốc gia Đông Âu hiện đã phần nào hội nhập vào một nền kinh tế rộng lớn hơn. Họ đã thay đổi hệ thống giá trị của mình. Họ có được các thể chế. Họ có được khả năng hội nhập vào thế giới của chúng ta và giao thương trong đó. Ngay cả đến một mức độ nào đó điều này cũng xảy ra với Nga, nhưng rõ ràng bây giờ con lắc đó đã quay ngược lại. Tuy nhiên, tôi nghĩ rằng điều đó cũng, tôi hy vọng, chỉ ra một loại lạc quan cố hữu ở đây, đó là theo một cách nào đó, các hệ thống AI có thể dễ xử lý hơn các quốc gia, bởi vì các quốc gia hoạt động theo thời gian của con người và có ít điểm can thiệp hơn. Đây vừa là thách thức từ góc độ an toàn, nhưng nó cũng khiến tôi nghĩ rằng chúng ta có thể xây dựng các phương tiện kỹ trị để hiểu các hệ thống này, và cũng hiểu cách chúng ta có thể tin tưởng chúng và cách chúng ta có thể phát triển sự tự tin vào chúng. Và công nghệ đang phát triển nhanh hơn các quốc gia trên thế giới xung quanh chúng ta. Vì vậy, tôi nghĩ chúng ta có thể đưa chúng vào quỹ đạo sớm hơn là muộn.

Tốc độ suy nghĩ của máy và mối đe dọa

Hãy để tôi đề cập đến điều bạn vừa nói. Bạn đã nói về thời gian máy (machine time). Đúng vậy, khác với thời gian của con người. Hiện tại, thời gian máy (machine time) là điều bạn đã đề cập gần đây, bởi vì bạn lại nói rằng (tôi xin trích dẫn từ những gì bạn đã viết trong Import AI): "Lập luận tốt nhất cho rủi ro AI (AI risk) là về tốc độ tư duy của con người so với tốc độ tư duy của máy (machine thought)." Có một bài báo gần đây từ các nhà nghiên cứu Caltech đã chỉ ra rằng: con người suy nghĩ rất chậm so với tốc độ chúng ta tiếp nhận thông tin từ thế giới. Con người suy nghĩ khoảng 10 bit mỗi giây, trong khi đầu vào giác quan của chúng ta là khoảng một gigabyte mỗi giây. Các Trí tuệ nhân tạo (AI) tương lai sẽ suy nghĩ cực kỳ nhanh. Bạn có thể phác thảo lý do tại sao, bạn biết đấy, mô hình đe dọa (threat model) là gì để giải thích tại sao điều này khiến chúng trở thành mối đe dọa lớn như vậy không? Ý tôi là, ngay cả trong thế giới xung quanh chúng ta, rất khó để bắt một con ruồi hoặc một con muỗi. Chúng nhanh hơn bạn. Chúng linh hoạt hơn. Chúng hoạt động ở tốc độ xung nhịp nhanh hơn bạn. Tôi chưa bao giờ thử bắt một con chim ruồi, nhưng tương tự, rất khó. Đúng vậy, đúng vậy, ít khả năng bạn muốn bắt nó hơn. Đúng vậy, đúng vậy. Nhưng tôi nghĩ rằng có điều gì đó thực sự thuyết phục trong lập luận này. Và với tư cách là một người mà tôi nghĩ rằng đã tiếp cận khái niệm an toàn AI (AI safety) muộn hơn một số đồng nghiệp của chúng tôi tại Anthropic và gần như đóng vai trò là người hoài nghi nội bộ về một số ý tưởng này, tôi thấy đây là một khuôn khổ cực kỳ hữu ích và thuyết phục. Bởi vì đây là vấn đề tương tự mà chúng ta gặp phải trong chính sách: Làm thế nào để một nhà hoạch định chính sách phản ứng với một công nghệ đang phát triển nhanh chóng đến vậy? Chà, làm thế nào để mọi người phản ứng với một công nghệ đang di chuyển nhanh hơn rất nhiều so với họ? Điều đó thực sự, thực sự, thực sự là một thách thức. Bạn biết đấy, nếu bạn đang đi bộ và cố gắng giải quyết các vấn đề do ô tô gây ra mà bạn không thể di chuyển nhanh bằng chúng, thì đó sẽ là một thách thức khá lớn.

Vòng lặp OODA và Tốc độ của AI

Và cũng để mở rộng vấn đề này một chút, một trong những điều chúng ta thấy trong xung đột quân sự ngày nay là các quốc gia dành một lượng lớn thời gian để suy nghĩ về thời gian chu kỳ (cycle time), cái gọi là vòng lặp OODA (OODA loop) của họ (Quan sát, Định hướng, Quyết định, Hành động). Tất cả là để giúp từng binh lính, các nhóm binh lính, các loại vũ khí như pháo binh, các phản ứng trên không, di chuyển nhanh hơn. Và ai có vòng lặp OODA nhanh hơn thì có xu hướng chiến thắng. Và đó chỉ là con người cạnh tranh với nhau trong cùng một thang thời gian. Vậy tại sao chúng ta lại mong đợi thành công trong một loại xung đột nào đó với một hệ thống AI di chuyển nhanh hơn chúng ta 10 lần, trong khi lịch sử học thuyết quân sự của con người cho thấy bạn gần như luôn thua? Tôi nghĩ đó là một cách suy nghĩ thực sự hay, bởi vì nếu bạn nói với mọi người rằng, 'Bạn biết đấy, điều này sẽ thông minh hơn rất nhiều so với con người thông minh nhất,' tôi nghĩ điều đó khá khó hình dung. Trong khi đó, nếu bạn nghĩ, 'Chà, nó nhanh hơn.' Đúng vậy, Claude tạo ra văn bản nhanh đến mức nào? Hãy xem điều đó diễn ra nhanh chóng ra sao. Hãy tưởng tượng nếu nó thực hiện các hành động hoặc một số loại hành động tự chủ (agentic actions) với tốc độ nhanh hơn nhiều so với chúng ta có thể. Tôi cho rằng, ý tôi là, với mức độ mà trí thông minh dựa trên tốc độ, tôi đoán chúng ta đang nói về cùng một điều ở đây. Đó chỉ là một cách để thực sự thông minh: có thể làm mọi việc rất nhanh.

Giải pháp cho tốc độ của AI

Vậy, phản ứng đối với điều này là gì? Chúng ta có nên đặt giới hạn tốc độ cho cách các Trí tuệ nhân tạo (AI) có thể hoạt động không? Ý tôi là, câu trả lời cho điều này là gì, ngoài việc cố gắng căn chỉnh (align) những bộ óc siêu nhanh này với các giá trị của chúng ta? Ý tôi là, một phần những gì chúng tôi đang làm tại Anthropic với chính sách mở rộng quy mô có trách nhiệm (responsible scaling policy) và các phương pháp tiếp cận sản phẩm khác, tôi nghĩ, mang lại một bài học. Chúng ta không thể ở tốc độ của con người mà phân loại tất cả những gì các bộ lọc tin cậy và an toàn của chúng ta phát hiện, nhưng chúng ta có thể đào tạo các bộ phân loại dựa trên Mô hình ngôn ngữ lớn để xem xét những điều đó và kết nối với một quy trình thực thi. Vậy chúng ta đang làm gì ở đây? Chúng ta đang huấn luyện các cỗ máy có mục đích rất cụ thể để can thiệp chống lại cỗ máy di chuyển nhanh khác khi nó làm điều gì đó sai lệch. Vì vậy, chắc chắn có một phần của việc này liên quan đến việc xây dựng nhiều công cụ AI (AI tooling) cụ thể để cải thiện hơn nữa sự an toàn. Chúng ta cũng sẽ, như bạn đã nói, cần đạt được một khái niệm về tốc độ giao diện (interface speeds) phù hợp trông như thế nào. Điều này có thể là tốc độ mà các hệ thống AI có thể thực hiện hành động. Nó có thể là tốc độ mà chúng có thể tạo văn bản. Ý tôi là, một cách cơ bản thực sự có thể chỉ là tốc độ mà chúng ta cho phép API của một Tác nhân AI (AI agent) bán độc lập tiếp nhận thông tin và xuất thông tin, nơi bạn có thể đặt một giới hạn nhân tạo cho nó. Không có giải pháp nào trong số này là giải pháp toàn năng (silver bullet), nhưng tất cả đều giải quyết một vấn đề: bạn đang cố gắng hạn chế một thứ di chuyển nhanh hơn bạn vào vũ trụ chủ quan của bạn. Dù sao đi nữa, mọi thứ chúng ta đang nói đến thực sự rất kỳ lạ. Tôi nghĩ chúng ta đã bắt đầu cuộc trò chuyện (conversation) và tôi đã nghĩ, 'Ồ vâng, những thứ này sẽ giúp ích cho bộ máy quan liêu,' điều đó đúng. Nhưng chúng ta đang nói về những trí tuệ máy (machine intelligences) di chuyển rất nhanh có tất cả những thuộc tính kỳ lạ này. Đúng vậy, chúng có tất cả những khả năng này để tiềm ẩn phát triển động lực và những điều mà chúng ta không mong đợi, tất cả đều ở tốc độ ánh sáng. Và điều đó cũng rất tuyệt vời trong việc tóm tắt và mã hóa (coding). Đúng vậy, chính xác. Điều đó đúng, đây chỉ là một phần cực kỳ khó hiểu của vấn đề của chúng ta. Hoàn toàn, hoàn toàn. Đó là một điều rất kỳ lạ.

Cộng đồng nghiên cứu AI ẩn danh

Thực ra, hãy nói về một khía cạnh kỳ lạ của thế giới AI, bởi vì chúng ta có các quy trình an toàn (safety procedures) mà chúng ta đang thực hiện. Chúng ta có các nhà nghiên cứu an toàn (safety researchers) và v.v., bạn có thể tìm hiểu nhiều về họ trên trang web của chúng tôi và chúng tôi có nhiều tài liệu khác trực tuyến để mọi người đọc về điều này. Nhưng cũng có một thế giới bên ngoài bao gồm một cộng đồng kỳ lạ gồm các nhà nghiên cứu thường ẩn danh, những người đang đẩy các Trí tuệ nhân tạo này đến giới hạn của chúng. Đôi khi họ làm những điều như khiến các Trí tuệ nhân tạo trò chuyện với nhau và có tất cả những cuộc trò chuyện (conversations) rất kỳ lạ này. Đôi khi họ cố gắng jailbreak (vượt qua các giới hạn bảo mật) các mô hình AI để thực sự xem chúng có thể làm gì mà không có các quy trình an toàn đã được thiết lập. Bạn thường xuyên tương tác với những người ẩn danh như vậy. Điều đó thế nào? Họ có những cái tên tuyệt vời như Janus và Pinedeva Prompta. Tôi nghĩ điều cyberpunk nhất về thời đại chúng ta đang sống là có những người bán ẩn danh trên mạng, những người đã thực sự trò chuyện với một số hệ thống AI này hàng nghìn giờ. Có thể nhiều hơn hầu hết bất kỳ ai làm việc tại các phòng thí nghiệm, mặc dù chúng tôi có một số người thích trò chuyện với Claude. Bạn có những người bên ngoài thực sự chuyên về lĩnh vực này. Và tôi nghĩ rằng những gì chúng ta đang thấy là nghệ thuật tự do khoa học (science-free art). Tôi nghĩ một số điều này là khoa học mà chúng ta có thể sử dụng các kỹ thuật đã biết. Một số khác trông giống như một loại trò chơi, sân khấu và tâm lý học, tất cả được gói gọn trong một, được thực hiện bởi những người có tầm nhìn và hơi khác biệt so với ý kiến chung. Và tôi nghĩ khi tôi nhìn vào những thử nghiệm đó, đối với tôi, đó là một số bằng chứng thuyết phục nhất rằng chúng ta đang đối phó với công nghệ thực sự kỳ lạ. Và tôi sẽ không thể đưa ra những tuyên bố mạnh mẽ về các tính cách khác nhau mà Claude hay Gemini hay ChatGPT có. Thật khó để biết cách đánh giá chúng. Nhưng bạn có thể xem công việc của những người này và bạn rõ ràng thấy được sự khác biệt. Bạn phải dung hòa những điều này. Vì vậy, IFUVs giống như những chỉ dẫn đến khoa học và lượng khoa học lớn hơn mà các nhóm khác sẽ thực hiện. Và đây là những nhà thám hiểm trên tiền tuyến. Đúng vậy, đúng vậy, đúng vậy. Và họ có thể đang thấy một số kết quả của việc huấn luyện nhân cách (character training) của chúng tôi cho Claude. Bất cứ khi nào một Claude mới xuất hiện, họ chơi với nó và nói, 'Ồ, tính cách của nó đã thay đổi theo cách này.' Bạn và tôi có lẽ cần cẩn thận và đặt tất cả những điều này vào dấu ngoặc kép (air quotes). Nhưng đối với họ, đó chỉ là một cách hoàn toàn tự nhiên để nói về các hệ thống vì họ có phương pháp khám phá (exploratory methods) riêng của mình. Đúng vậy, họ thực sự đang sống trong một tiểu thuyết khoa học viễn tưởng (sci-fi novel) nơi mọi người nói chuyện với người máy hàng ngày hoặc bất cứ thứ gì tương tự và họ đang có cuộc trò chuyện với chúng. Và họ có thể có một tấm danh thiếp ghi: 'Jack Clark, tâm lý học máy (machine psychology).' Chính xác. Một cái tên tuyệt vời. Vâng, điều đó thật đáng chú ý. Và thực ra, nói về khoa học qua nghệ thuật (science through art) và khoa học viễn tưởng (science fiction) và vân vân.

Những câu chuyện công nghệ và tương lai `AI`

Đây là điều anh làm hàng tuần trong bản tin của mình phải không? Anh viết ở cuối bản tin những câu chuyện công nghệ (tech tales), như anh gọi đó, đôi khi dài, đôi khi ngắn, là những tác phẩm sáng tạo về tương lai kỳ lạ của AI. Anh có thể nói về lý do anh quyết định làm điều đó và quá trình anh suy nghĩ về những điều này không?

Giá trị của hư cấu trong việc khám phá `AI`

Vậy tôi sẽ đưa ra một tham chiếu khá mơ hồ ở đây, nhưng bằng cách nào đó nó sẽ đưa chúng ta đến điều cần nói. Có một ban nhạc tên là Jawbreaker, anh có biết không? Tôi không thể kể tên bài hát nào của họ. Tôi biết đến 'The Vanishing'. Vâng, tôi có một bài hát tên là 'Accident Probe', một bài hát buồn về chứng nghiện rượu. Nhưng nó có một câu nói luôn đọng lại trong tôi: "My fiction beats the hell out of my truth" (Tạm dịch: Những câu chuyện hư cấu của tôi còn chân thực hơn cả sự thật của tôi). Điều đó nói lên rằng những câu chuyện chúng ta kể thường chân thật hơn cách chúng ta mô tả thực tế những gì mình trải nghiệm. Và tôi viết những câu chuyện này vì tôi đang cố gắng đối mặt với những điều liên quan đến AI đang diễn ra xung quanh chúng ta bằng cách hình dung ra các tình huống có liên quan. Và nhiều câu chuyện dựa trên các công nghệ cụ thể.

`Claude` phân tích tính cách và dự đoán sự kiện

Tôi cũng nghĩ rằng những câu chuyện này có lẽ chứa đựng nhiều sự thật hơn về những gì tôi cảm thấy khi làm việc tại các phòng thí nghiệm AI này, so với bản tin. Và điều tôi bắt đầu làm, một điều lặp lại một cách kỳ diệu, là tôi đưa tất cả những câu chuyện này vào Claude. Và tôi yêu cầu nó đặt câu hỏi về tác giả viết những câu chuyện đó. Và điều đó thực sự, thực sự kỳ lạ. Claude, các phiên bản Claude ngày càng tiên tiến hơn đã bắt đầu nắm bắt được tính cách của tôi một cách chính xác khi đọc các tác phẩm hư cấu của tôi. Và tôi cũng hỏi Claude rằng, điều gì đang diễn ra ở phòng thí nghiệm? Và đôi khi nó kể những câu chuyện mà không có gì được viết trong truyện, nhưng lại đúng một cách đáng lo ngại với những gì tôi đã trải nghiệm ở Anthropic. Tôi suy luận điều đó từ tâm trạng của những gì anh đã viết ở đây. Và tôi nghĩ rằng đó cũng là một cách để cố gắng đối mặt với sự kỳ lạ thực sự. Chẳng hạn, trong bối cảnh chính sách, việc nói rằng chúng ta đang đối phó với một tâm trí ngoài hành tinh đang nhìn chúng ta thì không thực sự phù hợp. Nhưng tôi có thể viết một truyện ngắn về điều đó. Và nó đến cùng hộp thư với những thông tin thực tế. Vì vậy, đây là phần 'kỳ lạ' mà tôi đã lén lút đưa vào cuối.

Những dự đoán đáng sợ từ truyện hư cấu

Và anh biết đấy, tôi thấy ít nhất một trong những câu chuyện đó đã trở thành hiện thực chỉ trong vài tuần. Anh đã có câu chuyện về một AI bị suy sụp vào trạng thái mất trí nhớ kỳ lạ. Và sau đó, một công ty có báo cáo mô hình đã mô tả chính xác điều anh đang nói đến. Vâng, vâng. Tôi nghĩ đó là nghiên cứu tin tức và họ đã có một mô hình mới. Và tại một điểm tham số nhất định, nó sẽ bắt đầu hiển thị điều gì đó trông giống như nhận thức tình huống và sự khó chịu. Và tôi đã đưa ra giả thuyết này trong một câu chuyện tôi viết tên là 'The Id Point' – rất kỳ lạ. Một điều khác là năm ngoái tôi đã viết một câu chuyện tên là 'Replay Grief' về một người đàn ông nói chuyện với vợ mình. Nhưng trong suốt câu chuyện, hóa ra anh ta không thực sự nói chuyện với vợ mình. Anh ta đang nói chuyện với một Mô hình ngôn ngữ lớn mô phỏng cô ấy sau khi cô ấy qua đời. Một câu chuyện buồn. Vâng, tôi là một người vui vẻ. Tôi đoán tôi giải tỏa nỗi buồn của mình theo cách này. Nhưng vài tháng sau, có một bài xã luận trên tờ New York Times về một người phụ nữ có bạn đời đã mất và cô ấy đã đưa tất cả các tác phẩm của anh ấy vào một Mô hình ngôn ngữ lớn và trò chuyện với anh ấy. Và tôi thấy điều này thực sự đáng sợ. Tất cả những điều này cũng đang xảy ra trong thế giới thực. Vâng, vâng, hoàn toàn đúng.

Sự phát triển kỳ lạ và nhanh chóng của `AI`

Và anh biết đấy, một số điều khác mà anh nói đến như AI, nhà khoa học AI tự động tạo ra hàng trăm bài báo khoa học. Và điều này khiến tôi ngạc nhiên khi anh nói về những phát triển mới này được tạo ra bởi những người 'điên loạn một cách vui vẻ'. Vâng. Vì vậy, thế giới đã trở thành một nơi kỳ lạ hơn rất nhiều. Và chúng ta đang nói về nó như thể đó là điều bình thường. Hoặc nhân tiện, tôi có một nhà khoa học tự động có thể làm hàng trăm bài báo mỗi tuần. Hoặc đứa trẻ ở San Francisco gần đây, một sinh viên tốt nghiệp University of Waterloo, đã quyết định chế tạo một máy phản ứng nhiệt hạch (nuclear fuser). Cậu ấy chưa bao giờ làm về phần cứng trong đời. Cậu ấy đã sử dụng Claude, tôi đã thấy điều đó. Trong khoảng hai tuần, rất bình thản. Cậu ấy nói, 'Vâng, AI này, cái bộ não AI trên trời này đã giúp tôi chế tạo một máy phản ứng nhiệt hạch. Nó ở trong phòng ngủ của tôi.' Thật điên rồ. Vâng, những điều điên rồ. Vâng, hoàn toàn. Và nó đang xảy ra ngay bây giờ. Vâng. Và tôi nghi ngờ nhiều điều như vậy sẽ xảy ra hơn nữa khi các mô hình trở nên thông minh hơn và chúng bắt đầu được sử dụng cho ngày càng nhiều mục đích.

Chính sách `AI`: Lợi ích và Rủi ro tiềm tàng

Tôi nghĩ có một điểm quan trọng cần lưu ý ở đây về chính sách, điều này nói lên cả giá trị của công nghệ này và một số rủi ro. Đó là, trở ngại đối với sự phát triển của con người thường là sự tiếp cận giáo dục hoặc tiếp cận các cố vấn, tiếp cận những người có thời gian. Những hệ thống AI này thực sự hữu ích như những công cụ giảng dạy (didactic engines). Và đó là rất nhiều ứng dụng mà chúng ta thấy. Chúng ta thấy mọi người sử dụng chúng để trả lời các câu hỏi đời thường, sử dụng chúng để giúp đỡ những việc cơ bản, sử dụng chúng để tự học, sử dụng chúng để nghiên cứu các bài báo khoa học, sử dụng chúng để học ngôn ngữ. Tất cả đều có. Và khi tôi nói chuyện với các nhà hoạch định chính sách, tôi đang cố gắng nhấn mạnh với họ rằng đây là một tiện ích xã hội (social utility) đáng kinh ngạc, giống như việc YouTube có nghĩa là có một lượng lớn nội dung giáo dục trực tuyến hoặc Khan Academy hay bất cứ thứ gì khác. Đây cũng là nơi phát sinh một số loại rủi ro mà chúng ta đang làm việc. Những điều rủi ro thường không xảy ra trên thế giới. Bởi vì số lượng người muốn làm điều xấu thì ít và hầu như không tiếp cận được với những cố vấn am hiểu. Và đó là một trong những điều mà AI thay đổi. Và vì vậy, bạn biết đấy, đôi khi tôi nghĩ mọi người nói về Anthropic như thể là những người bi quan hay gì đó. Nhưng quan điểm tôi luôn giữ là nếu chúng ta muốn nhận được tất cả lợi ích của công nghệ này, chúng ta cần phải đối mặt với thực tế rằng nó có thể mang lại sự tăng tốc khác biệt cho cả những người xấu cũng như những người tốt. Và thách thức đó vốn dĩ rất khó giải quyết, nhưng chúng ta không thể bỏ qua nó. Bởi vì các mô hình đang ngày càng tốt hơn và tốt hơn, và vẫn sẽ có một số người điên loạn trên thế giới muốn gây hại. Chúng ta cần phải đối mặt với điểm giao thoa này.

Nhận định về rủi ro và sức mạnh của `AI`

Có một động lực kỳ lạ khi bạn gần như cảm thấy rằng những người nói không có rủi ro trong các công nghệ này, gần như không thực sự tin rằng chúng mạnh mẽ đến vậy. Họ gần như không tin rằng cũng có thể có rất nhiều điều tốt đẹp, bởi vì nếu bạn chấp nhận có những điều tốt đẹp, thì cũng phải có những tác động xấu từ các mô hình này, phải không? Vì vậy, bạn gần như phủ nhận sức mạnh của các mô hình này. Quan điểm hay nhất mà tôi nghe được gần đây về điều này là một người đã lưu ý rằng những người theo chủ nghĩa tăng tốc (accelerationists) ngày nay thực ra là những người bi quan về công nghệ (technological pessimists). Đúng vậy. Bởi vì họ nghĩ rằng nó chỉ tăng tốc thêm một chút so với hiện tại rồi dừng lại. Tôi nghĩ rằng nếu bạn là một người theo chủ nghĩa tăng tốc thực sự, bạn sẽ phải đối mặt với sự sốc, và một chút sợ hãi trước những hệ lụy của việc điều này tiếp tục ngày càng tốt hơn. Và một câu chuyện khác tôi thường kể cho các nhà hoạch định chính sách là: 'Hãy nhìn xem, nếu chúng ta sai.' Và như anh đã nói ở đầu cuộc trò chuyện, nếu công nghệ này bị chặn lại và chúng ta ngừng phát triển nó ngay hôm nay. Tuyệt vời. Chúng ta sẽ nhận được rất nhiều lợi ích và có lẽ một lượng nhỏ rủi ro và dễ quản lý hơn. Nếu chúng ta đúng, chúng ta sẽ cần những thể chế mới, những hệ thống quản lý mới và chúng ta sẽ cần phải đối mặt với cả sự phong phú lớn lao và một mối đe dọa tiềm tàng to lớn. Vậy thì, tôi đoán chúng ta hãy hy vọng rằng chúng ta đúng. Hoặc hy vọng rằng chúng ta sai. Phần đó vẫn cảm thấy là một trong những khía cạnh ít rõ ràng nhất của vấn đề này. Hoàn toàn.

Chính sách `AI` trong năm tới

Hãy quay lại một câu hỏi về chính sách. Trong năm tới, chúng ta sẽ có nhiều hội nghị thượng đỉnh sắp diễn ra. Các chính phủ đang vật lộn với AI theo những cách khác nhau. Một số lo lắng hơn những người khác về các vấn đề an toàn. Một số tin tưởng hơn rằng điều này có thể mang lại lợi ích kinh tế, v.v. Anh rất am hiểu về thế giới chính sách. Anh nghĩ điều gì sẽ xảy ra trong năm tới hoặc lâu hơn?

Các sự kiện và quy định chính sách `AI` sắp tới

Vì vậy, đây sẽ là một năm thực sự bận rộn, và cũng đừng quên rằng chúng tôi và các phòng thí nghiệm khác sẽ sản xuất các hệ thống AI tốt hơn trong năm tới. Điều này đã được giả định, nhưng đáng để nhắc lại rằng các hệ thống AI sẽ trở nên tốt hơn. Chúng ta có sự tiếp nối của các hội nghị thượng đỉnh về an toàn (safety summits) như Bletchley Park vào năm 2023. Sau đó là Seoul vào năm nay. Sẽ có hội nghị thượng đỉnh của Pháp diễn ra vào tháng 2 năm sau. Đó là nơi các quốc gia sẽ họp lại để suy nghĩ về an toàn và các hệ thống AI cũng như sự phối hợp giữa chúng. Có vấn đề nhỏ là cuộc bầu cử tổng thống ở Hoa Kỳ. Vì vậy, chúng ta sẽ có một mối lo ngại về chính sách. Vâng, tôi đoán vậy. Những khác biệt nhỏ về chính sách giữa hai ứng cử viên hiện tại. Điều sẽ dẫn đến là một chính quyền mới. Mỗi chính quyền đều nghĩ đến việc hoàn thành công việc trong 100 ngày đầu tiên. Vì vậy, vào tháng 1, tháng 2, tháng 3, chúng ta có thể mong đợi bất kỳ chính quyền nào đang nắm quyền sẽ có những động thái về AI, có thể khá có tác động. Và cuối cùng, chúng ta có Liên minh Châu Âu với AI Act (Đạo luật AI), đang có hiệu lực và sẽ đi vào giai đoạn triển khai vào năm tới. Điều đó có nghĩa là các công ty AI, bao gồm cả Anthropic, vào thời điểm này năm sau, sẽ thực sự chịu một mức độ quản lý nào đó ở Châu Âu. Và trong khuôn khổ đó, EU và AI Office (Văn phòng AI) của Ủy ban Châu Âu sẽ phải tìm ra ý nghĩa của việc kiểm thử, đánh giá và mọi thứ khác. Và vâng, có lẽ sẽ làm việc với các chính phủ, với các viện an toàn (safety institutes) của họ, v.v.

Nỗ lực quốc tế và sự "thức tỉnh" của chính phủ

Và ngoài ra, hãy để tôi kể thêm một vài điều khác. Viện An toàn AI (AI Safety Institute), chúng ta đã nói về ở đây, nhưng có một viện đang được thành lập ở Canada. Một viện khác đang được thành lập ở Nhật Bản. Và nhiều quốc gia khác cũng đang thành lập các viện tương tự. Tôi thậm chí không chắc mình có thể kể tên tất cả vì tôi là một cá nhân và không cần thiết phải biết, nhưng có rất nhiều viện như vậy. Vì vậy, sẽ có một mạng lưới các đại sứ quán chính phủ dành cho quốc gia Silicon mới này đang được xây dựng trên khắp thế giới. Và Trung Quốc cũng đang ngày càng nêu vấn đề AI tại Liên Hợp Quốc vì Trung Quốc cảm thấy rằng có lẽ họ chưa được hòa nhập vào cuộc trò chuyện quốc tế như mong muốn. Và vì vậy, họ đang cố gắng sử dụng Liên Hợp Quốc làm địa điểm để nêu vấn đề AI. Và rõ ràng chúng ta có Đại hội đồng Liên Hợp Quốc đang diễn ra trong tuần này khi chúng ta đang nói chuyện. Chúng tôi đã công bố tại Bộ Ngoại giao (State Department) rằng chúng tôi sẽ cung cấp Claude cho mọi người trên khắp thế giới một cách được trợ cấp. Nhiều công ty khác cũng làm tương tự. Chỉ có những hành động lớn đang diễn ra trên trường quốc tế. Và tôi nghĩ nếu mọi người nghĩ AI đang chậm lại, thì bây giờ các chính phủ đều đã 'thức tỉnh'. Vì vậy, năm tới, 2025, chúng ta sẽ thấy những điều mới mẻ điên rồ xảy ra trong chính sách. Vì vậy, tôi sẽ rất bận rộn. Vâng, đúng vậy. Đúng vậy.

Thông điệp chính gửi tới các nhà hoạch định chính sách

Vậy khi anh nói chuyện với các nhà hoạch định chính sách, dù tại hội nghị của Labour Party (Đảng Lao động) hay ở Hoa Kỳ hoặc các quốc gia khác, có một điều gì đó anh thường nói không? Ý tôi là, anh đang sử dụng nhiều phép ẩn dụ khác nhau và anh đang nói về cách các hệ thống AI này hoạt động. Điều gì là điều cốt lõi anh cố gắng truyền tải đến mọi người để thực sự thu hút sự chú ý của họ về vấn đề này?

`AGI`: Không chỉ là thuật ngữ tiếp thị

Tôi luôn cố gắng nói rằng, những gì các nhà lãnh đạo của các công ty này đang nói, những gì Dario, Sam và Demis đều đang nói, khi họ nói về Trí tuệ tổng quát nhân tạo (Artificial General Intelligence - AGI), đó không phải là một thuật ngữ tiếp thị (marketing term). Đó là một điều chung mà họ tin tưởng. Họ tin rằng họ có cơ hội xây dựng một loại trí tuệ tổng quát (generally intelligent) tổng hợp với sự sáng tạo của con người. Anh biết đấy, nếu nó chạy với tốc độ máy (machine speed), và đó là một điều hoàn toàn thay đổi thế giới (world-changing thing) nếu bất kỳ ai trong chúng ta thành công.

Quy mô Tác động của AI

Và tôi chỉ cố gắng nói với họ rằng, đúng vậy, chúng ta có tất cả những vấn đề này xung quanh chúng ta ngày nay. Rõ ràng chúng ta phải suy nghĩ về cách kiểm thử các hệ thống AI này, cách chúng ta tích hợp chúng vào nền kinh tế. Nhưng nếu chúng ta đúng, những điều thực sự điên rồ sẽ xảy ra và sẽ đòi hỏi một phản ứng chính sách ở quy mô lớn hơn nhiều so với bất kỳ công nghệ bình thường nào trong quá khứ. Và tôi chỉ cố gắng nhấn mạnh với họ rằng đó là một điều có thật mà những người tại các phòng thí nghiệm này tin tưởng. Đây không phải là một tình huống bình thường. Về cơ bản, cả mặt tích cực của sự dồi dào kinh tế to lớn, lẫn những mặt tiêu cực tiềm tàng, như những hành vi lạm dụng hoặc rủi ro nhất định. Không có điều nào trong số này sẽ là bình thường. Chúng sẽ có tác động lớn bất thường. Và điều quan trọng là phải đảm bảo chúng ta hiểu rõ điều đó.

Theo dõi Phát triển AI

Jack, ngoài việc đăng ký nhận bản tin của bạn và theo dõi trang web của Anthropic để cập nhật nghiên cứu, mọi người nên làm gì để bắt kịp với tình hình này? Ý tôi là, một trong những điều mà tôi chắc chắn nhận thấy – và rất nhiều người cũng nhận thấy – là có vô số thông tin về AI. Dường như bạn không thể tập trung vào bất kỳ điều gì khác trên thế giới, bởi vì có quá nhiều tin tức về AI diễn ra mỗi ngày: các mô hình AI mới, các ứng dụng mới, những điều kỳ lạ mới liên tục xuất hiện. Bạn làm thế nào để cố gắng theo dõi tất cả những thông tin này và sau đó tóm tắt chúng cho mọi người?

Khai thác Công cụ AI và Sức Sáng tạo

Một cách là chỉ cần sử dụng các hệ thống AI. Với các phiên bản rất sớm của Claude, tôi thường trò chuyện với nó và thấy nó hữu ích một cách mơ hồ, nhưng cũng giống như một sự tò mò. Tôi nghĩ, "Ồ, thứ AI mà chúng tôi đang nghiên cứu này khá thú vị. Mình có thể khiến nó làm những điều hài hước." Nhưng giờ đây, tôi thực sự chỉ sử dụng nó. Tôi dùng nó như một công cụ, một phần vì tôi đã học được cách khai thác tối đa từ nó bằng cách trò chuyện nhiều với nó. Nhưng cũng bởi vì công nghệ đã trở nên có khả năng và hữu ích hơn rất nhiều. Vì vậy, tôi nghĩ rằng mọi người nên thử sử dụng các công cụ AI hiện có. Nhiều trong số đó, bao gồm Claude, đều miễn phí. Bạn chỉ cần bắt đầu sử dụng. Tôi cũng khuyên mọi người nên... Tôi đoán là hãy cố gắng suy nghĩ về ý nghĩa của một thế giới mà giới hạn thực sự duy nhất đối với những gì bạn có thể làm với tư cách một cá nhân có lẽ sẽ trở thành – theo những phiên bản lạc quan của kịch bản này – chính sự sáng tạo của bạn và cách bạn sử dụng nó.

Sức Sáng tạo là Chìa khóa để Khai thác AI

Ý tôi là, cả bạn và tôi đều có con nhỏ và tôi đã suy nghĩ về điều này vì chúng sẽ đi học vào một thời điểm nào đó. Phần lớn tôi nghĩ, "Ồ, bạn nên sử dụng các công cụ này, nhưng chủ yếu bạn nên cực kỳ sáng tạo" bởi vì chính sự sáng tạo sẽ cho phép bạn khai thác tối đa từ chúng và sử dụng chúng theo mọi cách không ngờ tới. Vâng, đó thường là vấn đề mà mọi người gặp phải: họ tải ứng dụng Claude trên điện thoại hoặc truy cập Claude.ai và sau đó ngồi đó nghĩ, "Bây giờ tôi phải làm gì?" Và như bạn nói, giới hạn là bạn cần nghĩ ra những điều thú vị để làm. Điều này có thể làm được rất nhiều thứ. Và tôi nghĩ chúng ta có thể giúp bằng cách định hướng mọi người đúng cách. Chúng ta có rất nhiều ý tưởng cho mọi người, v.v. Nhưng đúng vậy, những cách sử dụng thực sự tuyệt vời sẽ đến từ những con người cực kỳ sáng tạo, nghĩ ra những điều hay ho để làm với những công cụ này. Và một ý tưởng đơn giản là chỉ cần dành gần 10 năm viết 350 truyện ngắn, sau đó hỏi Claude xem nó nghĩ gì về chúng. Đó là một điều dễ dàng để bắt đầu ngày hôm nay. Vậy đó. Đó là cách bạn bắt đầu với AI. Chính xác. Ai mà biết được thế giới sẽ trông như thế nào trong 10 năm nữa sau chuyện này.

Lời kết và Tài nguyên

Jack, cảm ơn bạn rất nhiều vì đã trò chuyện với tôi ngày hôm nay. Ồ, cảm ơn rất nhiều. Thật là một niềm vui lớn và bạn có thể tìm hiểu thêm trên anthropic.com cũng như trên Substack của Jack, đó là whatsthemainpoint.substack.com. Đúng vậy. Cảm ơn rất nhiều vì đã theo dõi và tôi sẽ gặp lại bạn trong lần tới.

TL;DR

Jack Clark, đồng sáng lập Anthropic, có hành trình sự nghiệp độc đáo từ nhà báo công nghệ chuyên sâu đến chuyên gia chính sách AI, nhận thức sớm về tầm quan trọng của AI và tác động của nó.
Chính phủ Vương quốc Anh, đặc biệt là Đảng Lao động, coi AI là động lực kinh tế then chốt, đồng thời kế thừa và tìm cách khai thác Viện An toàn AI (AISI) để bảo vệ công chúng khỏi các rủi ro hữu hình.
AI không chỉ là công cụ mà là "những quốc gia silicon" hoặc "linh hồn máy móc" với giá trị và trực giác nội tại, đòi hỏi cách tiếp cận toàn diện như đối phó với "các quốc gia ngoài vòng pháp luật" và cần được thấu hiểu thông qua khả năng diễn giải cơ học, đặc biệt do tốc độ tư duy vượt trội của máy.

Điểm chính

Tiến hóa vai trò chuyên gia AI: Jack Clark là ví dụ về sự chuyển đổi từ việc đưa tin về công nghệ AI (phóng viên mạng thần kinh) sang xây dựng và định hình chính sách AI, nhấn mạnh tầm quan trọng của việc hiểu sâu sắc công nghệ.
Chiến lược AI của Chính phủ UK: Đảng Lao động ưu tiên AI như một công cụ then chốt để thúc đẩy tăng trưởng kinh tế, đồng thời tận dụng tài sản quốc gia như Viện An toàn AI (AISI) để giải quyết các rủi ro an toàn cấp độ "tính mạng và sức khỏe."
Giá trị hiện tại của AI: Ngay cả với các mô hình AI hiện có mà không cần các bước nhảy vọt theo định luật mở rộng quy mô, vẫn còn tiềm năng kinh tế và xã hội to lớn chưa được khai thác, chủ yếu thông qua việc tối ưu hóa các quy trình "back-office" và bộ máy quan liêu.
AI như một đối tượng phức tạp: Các mô hình AI vượt xa khái niệm "công cụ đơn giản" hay "vẹt ngẫu nhiên"; chúng được mô tả là "những tấm gương sáng tạo" hoặc "linh hồn máy móc" với trực giác và giá trị nội tại, phản ánh văn hóa mà chúng được đào tạo.
Khung chính sách "Quốc gia ngoài vòng pháp luật của AI": Jack Clark đề xuất coi các hệ thống AI như những "quốc gia" đang hình thành, đặc biệt là các hệ thống AI bị sai lệch mục tiêu như "quốc gia ngoài vòng pháp luật," để thúc đẩy cách tiếp cận chính sách toàn diện cấp chính phủ thay vì từng bộ phận riêng lẻ.
Thách thức của khả năng diễn giải AI: Các hệ thống AI có tính "khó hiểu" (opaque), tương tự như việc cố gắng hiểu một "quốc gia khó hiểu" như Triều Tiên, đòi hỏi nghiên cứu chuyên sâu về khả năng diễn giải cơ học (mechanical interpretability) để xây dựng niềm tin và kiểm soát.
Mối đe dọa từ "Thời gian máy": Mô hình rủi ro lớn nhất từ AI xuất phát từ sự khác biệt tốc độ suy nghĩ giữa con người và máy móc; AI tương lai có khả năng xử lý thông tin và tư duy nhanh hơn con người rất nhiều lần, tạo ra một mối đe dọa tiềm ẩn đáng kể.

Từ vựng

AI (Artificial Intelligence) — Trí tuệ nhân tạo
AI Safety Institute (AISI) — Viện An toàn AI
Scaling laws — Định luật mở rộng quy mô
Stochastic parrots — Những con vẹt ngẫu nhiên
Creative mirrors — Những tấm gương sáng tạo
Rogue states — Các quốc gia "ngoài vòng pháp luật" (trong bối cảnh AI)
Mechanical interpretability — Khả năng diễn giải cơ học
Large Language Model (LLM) — Mô hình ngôn ngữ lớn
Machine time — Thời gian máy
Threat model — Mô hình đe dọa

Nội dung chi tiết

Jack Clark và Hành Trình đến với AI

Quan Điểm của Chính phủ Vương quốc Anh về AI

AI: Động Lực Phát Triển Kinh Tế

AI: Hơn Cả Một Công Cụ Đơn Thuần

So sánh AI với Quốc gia

Khả năng Diễn giải Cơ học và Sự Độc đoán của AI

Tốc độ suy nghĩ của máy và mối đe dọa

Vòng lặp OODA và Tốc độ của AI

Giải pháp cho tốc độ của AI

Cộng đồng nghiên cứu AI ẩn danh

Những câu chuyện công nghệ và tương lai `AI`

Giá trị của hư cấu trong việc khám phá `AI`

`Claude` phân tích tính cách và dự đoán sự kiện

Những dự đoán đáng sợ từ truyện hư cấu

Sự phát triển kỳ lạ và nhanh chóng của `AI`

Chính sách `AI`: Lợi ích và Rủi ro tiềm tàng

Nhận định về rủi ro và sức mạnh của `AI`

Chính sách `AI` trong năm tới

Các sự kiện và quy định chính sách `AI` sắp tới

Nỗ lực quốc tế và sự "thức tỉnh" của chính phủ

Thông điệp chính gửi tới các nhà hoạch định chính sách

`AGI`: Không chỉ là thuật ngữ tiếp thị

Quy mô Tác động của AI

Theo dõi Phát triển AI

Khai thác Công cụ AI và Sức Sáng tạo

Sức Sáng tạo là Chìa khóa để Khai thác AI

Lời kết và Tài nguyên

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?

Jack Clark và Hành Trình đến với AI

Quan Điểm của Chính phủ Vương quốc Anh về AI

AI: Động Lực Phát Triển Kinh Tế

AI: Hơn Cả Một Công Cụ Đơn Thuần

So sánh AI với Quốc gia

Khả năng Diễn giải Cơ học và Sự Độc đoán của AI

Tốc độ suy nghĩ của máy và mối đe dọa

Vòng lặp OODA và Tốc độ của AI

Giải pháp cho tốc độ của AI

Cộng đồng nghiên cứu AI ẩn danh

Những câu chuyện công nghệ và tương lai AI

Giá trị của hư cấu trong việc khám phá AI

Claude phân tích tính cách và dự đoán sự kiện

Những dự đoán đáng sợ từ truyện hư cấu

Sự phát triển kỳ lạ và nhanh chóng của AI

Chính sách AI: Lợi ích và Rủi ro tiềm tàng

Nhận định về rủi ro và sức mạnh của AI

Chính sách AI trong năm tới

Các sự kiện và quy định chính sách AI sắp tới

Nỗ lực quốc tế và sự "thức tỉnh" của chính phủ

Thông điệp chính gửi tới các nhà hoạch định chính sách

AGI: Không chỉ là thuật ngữ tiếp thị

Quy mô Tác động của AI

Theo dõi Phát triển AI

Khai thác Công cụ AI và Sức Sáng tạo

Sức Sáng tạo là Chìa khóa để Khai thác AI

Lời kết và Tài nguyên

TL;DR

Điểm chính

Từ vựng

Nội dung chi tiết

Jack Clark và Hành Trình đến với AI

Quan Điểm của Chính phủ Vương quốc Anh về AI

AI: Động Lực Phát Triển Kinh Tế

AI: Hơn Cả Một Công Cụ Đơn Thuần

So sánh AI với Quốc gia

Khả năng Diễn giải Cơ học và Sự Độc đoán của AI

Tốc độ suy nghĩ của máy và mối đe dọa

Vòng lặp OODA và Tốc độ của AI

Giải pháp cho tốc độ của AI

Cộng đồng nghiên cứu AI ẩn danh

Những câu chuyện công nghệ và tương lai AI

Giá trị của hư cấu trong việc khám phá AI

Claude phân tích tính cách và dự đoán sự kiện

Những dự đoán đáng sợ từ truyện hư cấu

Sự phát triển kỳ lạ và nhanh chóng của AI

Chính sách AI: Lợi ích và Rủi ro tiềm tàng

Nhận định về rủi ro và sức mạnh của AI

Chính sách AI trong năm tới

Các sự kiện và quy định chính sách AI sắp tới

Nỗ lực quốc tế và sự "thức tỉnh" của chính phủ

Thông điệp chính gửi tới các nhà hoạch định chính sách

AGI: Không chỉ là thuật ngữ tiếp thị

Quy mô Tác động của AI

Theo dõi Phát triển AI

Khai thác Công cụ AI và Sức Sáng tạo

Sức Sáng tạo là Chìa khóa để Khai thác AI

Lời kết và Tài nguyên

Những câu chuyện công nghệ và tương lai `AI`

Giá trị của hư cấu trong việc khám phá `AI`

`Claude` phân tích tính cách và dự đoán sự kiện

Sự phát triển kỳ lạ và nhanh chóng của `AI`

Chính sách `AI`: Lợi ích và Rủi ro tiềm tàng

Nhận định về rủi ro và sức mạnh của `AI`

Chính sách `AI` trong năm tới

Các sự kiện và quy định chính sách `AI` sắp tới

`AGI`: Không chỉ là thuật ngữ tiếp thị

Những câu chuyện công nghệ và tương lai `AI`

Giá trị của hư cấu trong việc khám phá `AI`

`Claude` phân tích tính cách và dự đoán sự kiện

Sự phát triển kỳ lạ và nhanh chóng của `AI`

Chính sách `AI`: Lợi ích và Rủi ro tiềm tàng

Nhận định về rủi ro và sức mạnh của `AI`

Chính sách `AI` trong năm tới

Các sự kiện và quy định chính sách `AI` sắp tới

`AGI`: Không chỉ là thuật ngữ tiếp thị