- OpenClaw, dự án AI mã nguồn mở đang phát triển nhanh nhất thế giới, đối mặt với thách thức lớn về quản lý tăng trưởng thần tốc và xử lý hàng nghìn cảnh báo bảo mật, nhiều trong số đó là do AI tạo ra và không thực sự nghiêm trọng.
- Ngành công nghiệp đang tồn tại một xu hướng "kích động nỗi sợ hãi" và thông tin sai lệch về mức độ "không an toàn" của các tác nhân AI, bỏ qua các khuyến nghị bảo mật quan trọng như cô lập môi trường và hạn chế quyền truy cập.
- Peter Steinberger gia nhập OpenAI nhưng vẫn duy trì OpenClaw Foundation, với sự hỗ trợ từ OpenAI và các công ty công nghệ lớn, nhằm đảm bảo dự án luôn mở, dễ tiếp cận và phát triển bền vững để thúc đẩy hiểu biết về AI trong cộng đồng.
State of the Claw — Peter Steinberger
- OpenClaw đã trải qua mức độ tăng trưởng chưa từng có trên GitHub, được mô tả là "Stryper Pole" thay vì "hockey stick", đạt hàng chục nghìn commit và gần 2.000 contributors chỉ trong 5 tháng.
- Quản lý một dự án mã nguồn mở lớn với tình nguyện viên rất khó khăn, giống như điều hành một công ty ở chế độ khó; mục tiêu là cải thiện "bus factor" bằng cách đa dạng hóa đội ngũ đóng góp.
- Dự án nhận được một lượng lớn cảnh báo bảo mật (trung bình 16,6 cảnh báo/ngày), gấp đôi so với Linux kernel, nhưng nhiều trong số đó bị đánh giá là "AI Slop" hoặc phóng đại mức độ nghiêm trọng.
- Các vấn đề bảo mật thường phát sinh từ việc người dùng không tuân thủ khuyến nghị cài đặt an toàn, như chạy tác nhân ở "sudo mode" hoặc không sử dụng môi trường biệt lập (sandboxing).
- Các "hệ thống tác nhân" (agent systems) nói chung đều có rủi ro nếu chúng có quyền truy cập vào dữ liệu nhạy cảm, nội dung không đáng tin cậy và khả năng giao tiếp, không chỉ riêng OpenClaw.
- Việc sàng lọc các báo cáo bảo mật do AI tạo ra là một gánh nặng lớn về thời gian và đòi hỏi chuyên môn của con người, vì các báo cáo này thường không kèm theo bản vá chất lượng.
- OpenClaw Foundation được thành lập với sự hỗ trợ từ OpenAI và các đối tác như NVIDIA, Microsoft, Red Hat, Tencent, ByteDance để đảm bảo tính mở, cung cấp tài nguyên và thuê nhân sự toàn thời gian, giải phóng nhà sáng lập cho các công việc đổi mới.
- OpenAI hỗ trợ OpenClaw vì nhận thấy giá trị của việc tăng cường tiếp xúc cộng đồng với AI mã nguồn mở, giúp mọi người hiểu cả rủi ro lẫn tiềm năng của công nghệ này.
AI— Trí tuệ nhân tạotác nhân— agentStryper Pole— tăng trưởng kiểu Stryper Pole (tăng trưởng rất nhanh, gần như thẳng đứng)bus factor— yếu tố xe buýt (mức độ phụ thuộc vào một cá nhân)môi trường biệt lập— sandboxed environment / isolated environmentmô hình— model (AI model)thực thi mã từ xa (RCE)— Remote Code Executionchuỗi cung ứng— supply chainAI Slop— nội dung AI vô nghĩa/hời hợtmã nguồn mở (Open Source)— open source
Giới thiệu và Tăng trưởng của OpenClaw
Diễn giả tiếp theo của chúng ta là người sáng lập OpenClaw, dự án AI mã nguồn mở phát triển nhanh nhất thế giới. Gần đây, anh ấy đã gia nhập OpenAI để tập trung vào việc đưa các tác nhân đến với mọi người. Xin mời cùng chào đón Peter Steinberger lên sân khấu.
Chào buổi sáng mọi người, Swiss đã yêu cầu tôi trình bày về tình hình của OpenClaw. Ai ở đây đang chạy OpenClaw? Xin giơ tay. Khoảng 30% hoặc 40%. Rất tốt. Vâng, đã vài tháng trôi qua. Dự án hiện đã 5 tháng tuổi. Tôi nghĩ có thể nói rằng chúng tôi là dự án phát triển nhanh nhất trong lịch sử GitHub. Nếu bạn đã xem biểu đồ, một số dự án trông giống như gậy hockey stick, nhưng của chúng tôi thì giống như một đường thẳng đứng, thậm chí có người gọi đó là tăng trưởng kiểu Stryper Pole.
Thử thách của Tăng trưởng Nhanh và Quản lý Tổ chức
Và điều đó đi kèm với những thách thức riêng. Hiện tại, tôi nghĩ chúng tôi có số lượng GitHub stars lớn nhất. Có một vài dự án lớn hơn, nhưng xét về mục tiêu giáo dục cơ bản, không có dự án phần mềm nào khác lớn đến vậy. Dự án có khoảng 30.000 commits, chúng tôi sắp đạt 2.000 contributors và sẽ sớm có 30.000 pull request (PR). Chúng tôi không hề chậm lại. Bạn có thể thấy đó là một đà tăng trưởng mạnh mẽ, và hôm nay mới là ngày 9 tháng 4, nên tốc độ vẫn đang rất tốt.
Đồng thời, mọi thứ không hề dễ dàng. Tôi đã có hai lựa chọn khi quyết định mình muốn làm gì. Tôi đã làm việc theo mô hình công ty rồi, và tôi không muốn làm lại điều đó. Sau đó tôi gia nhập OpenAI, nhưng chúng tôi cũng thành lập OpenClaw Foundation. Giờ đây, tôi có hai công việc. Điều hành quỹ giống như điều hành một công ty ở chế độ khó, vì bạn phải lo tất cả mọi thứ, nhưng lại có rất nhiều tình nguyện viên mà bạn không thể thực sự chỉ đạo được. Vì vậy, một trong những mục tiêu của tôi là cải thiện bus factor – tức là ai sẽ là người thực hiện các commit. Và bạn thấy rằng tình hình đang dần được cải thiện. Vincent sẽ nói chuyện sau tôi. Nhưng anh ấy vẫn chưa thể đảm nhận toàn bộ.
Trong những tháng gần đây, tôi đã nói chuyện với rất nhiều công ty. Hiện chúng tôi có người của NVIDIA tham gia, có người từ Microsoft để hỗ trợ về MS Teams và ứng dụng Windows. Chúng tôi có người từ Red Hat, người đã giúp chúng tôi rất nhiều về bảo mật và tài liệu. Chúng tôi hợp tác với nhiều công ty Trung Quốc; có người từ Tencent và ByteDance. Họ thực sự là những người dùng lớn hơn bất kỳ châu lục nào khác. Và có người từ khắp nơi trên thế giới.
Bối cảnh An ninh của OpenClaw
Nhưng điều chính mà tôi muốn nói một chút là về OpenClaw, một dự án "không an toàn". Bạn biết đấy, bạn đã thấy các meme. OpenClaw "mời gọi những kẻ xấu". Và bạn có lẽ đã thấy các công ty như NVIDIA làm NemoClaw và mỗi người đều có "những con tôm hùm" của riêng họ. Bạn cũng nhận thấy rằng trong hai hoặc ba tháng qua, có rất nhiều bản phát hành mà mọi thứ bị hỏng. Tôi về cơ bản đã bị choáng ngợp bởi các cảnh báo bảo mật. Đó là những gì tôi đã làm và tập trung vào.
Cho đến nay, chúng tôi nhận được 1.142 cảnh báo. Con số đó khoảng 16,6 cảnh báo mỗi ngày. 99 trong số đó là cực kỳ nghiêm trọng. Chúng tôi đã công bố khoảng 469 cảnh báo và đã đóng 60% trong số đó. Những con số này nghe có vẻ cực kỳ đáng sợ. Nếu bạn so sánh nó, ví dụ, với các dự án lớn khác, như Linux kernel nhận được khoảng tám hoặc chín cảnh báo mỗi ngày. Chúng tôi nhận được gấp đôi. Curl có 600 báo cáo. Chúng tôi có gấp đôi Curl.
Mỗi khi tôi nhận được một sự cố bảo mật, quy tắc là: ai càng la hét về mức độ nghiêm trọng, thì càng có khả năng đó là AI Slop (nội dung vô nghĩa/hời hợt). Như chúng ta có lẽ cũng đã thấy tin tức, chúng ta đang nhanh chóng tiến vào một thế giới mà chúng ta phải thay đổi cách phát triển phần mềm, bởi vì tất cả các công cụ AI này đang trở nên rất giỏi trong việc xác định ngay cả những exploit đa chuỗi kỳ lạ nhất, và chúng ta sẽ làm hỏng tất cả phần mềm hiện có.
Tôi sẽ đưa ra một ví dụ: NVIDIA đã ra mắt NemoClaw, và NemoClaw là một plugin và lớp bảo mật cho OpenClaw, được đặt trong một môi trường biệt lập. Bài phát biểu chính diễn ra vào thứ Hai, họ đã mời tôi vào Chủ Nhật để làm việc cùng. Tôi đã kết nối nó với bảo mật mã nguồn. Nó đã tìm thấy khoảng năm cách khác nhau để thoát khỏi môi trường biệt lập an toàn của họ chỉ trong nửa giờ. Điều đó là do nếu bạn sử dụng sản phẩm đó, bạn sẽ có quyền truy cập vào mô hình nền tảng thông minh hơn đáng kể về mặt an ninh mạng so với những gì công chúng có thể truy cập, chính xác là vì nó nguy hiểm.
Nhưng vâng, toàn bộ ngành công nghiệp này, đối với những người đó, nó giống như điểm thưởng phải không? Càng tìm thấy nhiều lỗi, họ càng được chú ý. Vì vậy, OpenClaw giống như sản phẩm "không an toàn" mà mọi người đều cố gắng bẻ khóa. Vì vậy, theo đúng nghĩa đen là hàng trăm người đã khởi động các công cụ của họ để cố gắng bẻ khóa OpenClaw. Bề mặt tấn công điển hình là thực thi mã từ xa (Remote Code Execution - RCE), bỏ qua phê duyệt, tiêm mã (code injection), lỗ hổng mật khẩu. Nghe có vẻ rất nguy hiểm.
Xử lý Lỗ hổng Bảo mật: Ví dụ CVSS 10
Tôi sẽ cung cấp cho bạn một ví dụ cụ thể. GHSA-4GP, đây là một vấn đề có điểm CVSS là 10, nghĩa là nó là điều đáng sợ nhất mà bạn có thể gặp phải. Đây là một vấn đề mà nếu bạn đồng bộ hóa, ví dụ, ứng dụng iPhone mà chúng tôi thậm chí còn chưa phát hành, nhưng đang trong quá trình phát triển, và bạn chỉ cấp cho nó quyền đọc, thì bạn có thể bẻ khóa hệ thống để cũng có được quyền ghi. Lỗi này nghiêm trọng đến mức... Tôi không biết, lỗi này thực sự khác biệt về mặt thực tế. Nó thậm chí không phải là một sự cố vì trường hợp sử dụng điển hình là bạn cài đặt nó trên máy của mình, dù là trên đám mây hay trên Mac Mini (tôi đã ngừng đấu tranh với điều này, bây giờ tôi chỉ để mọi người vui vẻ thôi). Nhưng trong 99,99% các trường hợp, bạn sẽ có quyền truy cập vào gateway của mình hoặc bạn sẽ không có quyền truy cập vào gateway đó.
Để tự bào chữa, đây là lỗi của tôi khi tôi cố gắng tạo ra một mô hình linh hoạt hơn. Ví dụ, nếu bạn có các thiết bị hướng đến lời nói, và sau đó chúng tôi chỉ muốn đọc một số thứ nhất định, thì có một số trường hợp sử dụng mà một hệ thống quyền hạn giảm thiểu có thể có ý nghĩa. Nhưng không ai sử dụng điều đó. Nhưng điều này không quan trọng vì các quy tắc về cách bạn tạo ra các số CVSS không đóng góp vào điều đó chút nào. Và tôi đã cố gắng tuân thủ các quy tắc. Vì vậy, nó là một lỗi 10/10 và cả thế giới đang phát cuồng vì những sự cố mà trên thực tế không ảnh hưởng đến mọi người.
Tấn công Từ bên Ngoài và Chuỗi Cung ứng
Có một số vấn đề khác thực sự ảnh hưởng đến mọi người. Chúng tôi có các quốc gia đang cố gắng tấn công người dùng. Có GhostClaw, có khả năng đến từ Triều Tiên, về cơ bản là gây nhầm lẫn cho mọi người bằng một npm package khác. Và nếu bạn truy cập một trang web sai và cố gắng tải xuống, bạn sẽ nhận được một rootkit. Điều đó nằm ngoài tầm kiểm soát của chúng tôi. Điều đó cũng xảy ra với những người khác.
Ngoài ra, còn có vấn đề với Axios, điều thú vị là chúng tôi không sử dụng Axios. Nhưng chúng tôi đang sử dụng MS Teams hoặc Slack như một dependency (thành phần phụ thuộc). Và chúng sử dụng Axios và đã không pin phiên bản phụ thuộc của chúng. Và tất nhiên, vì đó là cách các cuộc tấn công chuỗi cung ứng hoạt động, chúng tôi cũng bị ảnh hưởng.
Làm thế nào để bạn sống sót? 1.142 [báo cáo], tôi chắc rằng sẽ lên 2.050. Trong một thời gian, tôi đã cố gắng tự mình xử lý vòng lặp này, điều đó hoàn toàn không thể. Vì vậy, cách nhanh nhất để nhận được sự giúp đỡ là nhận được sự giúp đỡ từ các công ty. Và NVIDIA đã thực sự tuyệt vời khi cung cấp cho chúng tôi một số người về cơ bản làm việc toàn thời gian, xem xét các AI Slop và củng cố cơ sở mã.
Đối phó với Kích động Nỗi Sợ hãi và Thông tin Sai lệch
À, còn một góc độ khác nữa. Góc độ còn lại là có rất nhiều công ty đang kích động nỗi sợ hãi. Và không chỉ các công ty, mà cả các trường đại học nữa. Tôi không biết bạn có thấy không, có một bài báo đã gây xôn xao, "Agents of Chaos" (Các tác nhân của hỗn loạn). Và họ nói, đó là về các tác nhân nói chung, nhưng sau đó có bốn trang giải thích kiến trúc OpenClaw một cách chi tiết nhất. Nhưng bạn biết trang nào họ thậm chí còn không đề cập đến không? Đó là trang bảo mật nơi chúng tôi giải thích cách bạn nên cài đặt nó. Bởi vì khi đó sẽ không vui, khi đó sẽ không... Sẽ khó tạo ra một câu chuyện hấp dẫn. Vì vậy, thay vào đó, họ đã bỏ qua tất cả các khuyến nghị chúng tôi đưa ra về bảo mật.
Khuyến nghị là: đây là tác nhân cá nhân của bạn. Đừng đặt nó vào một nhóm chat. Nếu bạn đặt nó vào một nhóm chat, hãy bật môi trường biệt lập lên. Bởi vì nếu bất kỳ ai cũng có thể nói chuyện với tác nhân của bạn, họ có thể khai thác nó cho bất cứ điều gì mà tác nhân đó có thể làm. Vì vậy, nếu đó là tác nhân nhóm, nó chỉ nên biết những gì nhóm có thể biết và không có bất kỳ dữ liệu bí mật nào. Và bạn có lẽ muốn hạn chế nó. Nếu đó là tác nhân cá nhân của bạn, bạn nên là người duy nhất có thể nói chuyện với nó.
Nhưng nếu bạn không tuân thủ các quy tắc, bạn có thể nhận được một số tương tác thực sự "thú vị". Giống như, này, tôi có thể nói chuyện với tác nhân của bạn và nó có thể phá vỡ hệ thống của bạn. Và sau đó, bởi vì tôi đã chất vấn họ một chút vì tôi có một số câu hỏi, "các bạn làm việc đó như thế nào?" Họ nói với tôi, ồ vâng, không, chúng tôi chạy nó ở chế độ sudo mode bởi vì chúng tôi muốn tác nhân hoạt động mạnh mẽ nhất có thể. Vì vậy, họ thực sự nghĩ rằng họ đã thiết lập... Thực ra không dễ để chạy nó ở chế độ sudo mode, bạn phải thay đổi mã nguồn. Nhưng họ không đề cập đến điều đó trong báo cáo vì một lần nữa, điều đó sẽ không mang lại cho họ uy tín.
Vì vậy, sự thất vọng hiện tại của tôi là: có cả một ngành công nghiệp cố gắng đặt dự án vào một ánh sáng tiêu cực. Nó là một cơn ác mộng. Nó không an toàn theo mặc định. Nó không thể chấp nhận được. Và trong khi đó, rất nhiều người yêu thích nó. Và những người thực sự đọc tài liệu bảo mật sẽ hiểu và có thể sử dụng nó một cách ổn thỏa.
Ba Yếu tố Rủi ro Chí tử của Hệ thống Tác nhân
Một ví dụ mà tôi thấy đặc biệt tuyệt vời là chúng tôi đã có một RCE (thực thi mã từ xa) đã gây hoảng loạn ở Bỉ. Cục an ninh mạng Bỉ đã phát hành một thông báo về môi trường thực thi mã từ xa. Và toàn bộ lỗi là một tính năng mà một trang web độc hại có thể tạo một liên kết sẽ kích hoạt gateway và sau đó chuyển tiếp mã thông báo gateway của bạn.
Bây giờ, nếu bạn sử dụng thiết lập mặc định và được khuyến nghị, mã thông báo gateway chỉ có hiệu lực cục bộ. Hoặc nếu cần, nó nằm trong mạng riêng của bạn. Không có trang web bên ngoài nào thực sự có thể truy cập nó. Nếu bạn chủ động chống lại thiết lập này, ví dụ, bạn sử dụng triển khai đám mây để thiết lập nó mà không đọc tài liệu, bạn có thể khiến thiết lập đó hoạt động. Nhưng một lần nữa, điều đó không giống như những gì được nêu trên trang web.
Thành thật mà nói, vâng, hoàn toàn có rủi ro. Rủi ro lớn là, về cơ bản, bộ ba yếu tố chí tử. Bất kỳ hệ thống tác nhân nào có quyền truy cập vào dữ liệu của bạn, có quyền truy cập vào nội dung không đáng tin cậy và khả năng giao tiếp đều có nguy cơ tiềm ẩn. Đó không phải là điều gì đặc biệt của OpenClaw. Giống như bất kỳ tác nhân nào, bất kỳ hệ thống AI mạnh mẽ nào cũng có vấn đề. Bạn càng làm cho nó mạnh mẽ, nó càng có thể làm nhiều việc cho bạn. Nhưng bạn cũng càng phải hiểu nó đang làm gì. Vì vậy, đây là vấn đề chính. Nhưng mọi người không nói về nó.
Gánh nặng Báo cáo An ninh do AI Tạo ra
Vâng, và sau đó là một phần về việc duy trì. Vấn đề là nếu bạn nhận được tất cả các cảnh báo bảo mật đó, bạn biết rằng hầu hết chúng được tạo ra bằng tác nhân AI. Nhưng bạn vẫn phải sử dụng trí óc của mình để thực sự đọc chúng vì chúng ta chưa đến mức có thể hoàn toàn tin tưởng, hoặc tôi chưa đến mức có thể hoàn toàn tin tưởng rằng tác nhân sẽ tự mình tìm ra vấn đề. Vì vậy, đó là một gánh nặng lớn về thời gian.
Đôi khi bạn có thể đoán được. Bất cứ khi nào báo cáo quá tử tế hoặc ai đó xin lỗi, rất có thể đó là AI, bởi vì thông thường mọi người quá thiếu tự tin để không xin lỗi. Nhưng đó là một vấn đề lớn. Và đó là điều mà tôi thấy ngày càng nhiều dự án OpenClaw than phiền, như việc gây ra các lỗi. Một số rất công khai về điều đó, như FFmpeg.
Thông thường bạn chỉ nhận được báo cáo. Rất hiếm khi thực sự nhận được một báo cáo kèm theo một bản vá. Nếu bạn nhận được báo cáo kèm theo bản vá, đó thường là một bản vá rất tệ. Nếu bạn vội vàng, như tôi đôi khi đã làm lúc ban đầu vì quá tải, bạn chắc chắn sẽ làm hỏng sản phẩm. Vì vậy, đây là điều rất khó để thực hiện chỉ với các tình nguyện viên.
Tầm nhìn Tương lai: OpenClaw Foundation và OpenAI
Vậy chúng ta đang làm gì? Điều số một là, mọi người nói rằng OpenAI đã mua OpenClaw. Điều đó không đúng. Họ có thể đã mua linh hồn tôi thật. Nhưng họ rất hiểu rằng để thế giới cần gì, đó là nhiều người hơn chơi với Trí tuệ nhân tạo để hiểu Trí tuệ nhân tạo có thể làm gì, để cả hiểu rủi ro và cả những khả năng.
Họ hiểu rằng nếu bạn, hoặc một người chưa từng chơi, chưa từng sử dụng Trí tuệ nhân tạo, đột nhiên ở nhà và sử dụng OpenClaw, họ sẽ đến nơi làm việc. Và họ sẽ hỏi, "Tại sao chúng ta không có Trí tuệ nhân tạo ở nơi làm việc?" Vì vậy, họ rất hiểu rằng việc hỗ trợ dự án này rất hữu ích. Và để dự án đó thành công, nó không thể nằm dưới sự kiểm soát của một công ty duy nhất. Do đó, tôi đang xây dựng một "Thụy Sĩ" với OpenClaw Foundation. Và tôi có David giúp tôi. Nó gần như đã hoàn thành.
Tình hình tài chính và Hướng đi của OpenClaw
Thứ duy nhất đang giữ chúng tôi tiếp tục là hệ thống ngân hàng Mỹ, vốn khá chậm và rất khó hiểu khi bạn không phải là người Mỹ. Nó được lấy cảm hứng từ những gì Gosti đã làm. Điều này thực sự sẽ giúp chúng tôi thuê thêm nhân sự toàn thời gian để vừa duy trì tốc độ, vừa cải thiện chất lượng. Nó cũng sẽ giải phóng một phần thời gian của tôi để tôi có thể tiếp tục làm những điều thú vị. Và cập nhật đôi chút về tình hình Claw. Tôi sẽ có mặt sau cho phần Hỏi & Đáp. Cảm ơn đã lắng nghe. Được rồi. Tuyệt vời. Cảm ơn vì tiếng hô. Yêu thích tiếng hô đó.
Giới thiệu phiên Breakout Claw
Được rồi, bạn đã chọn chủ đề Claw để bắt đầu các phiên thảo luận chuyên sâu của chúng ta. Tôi nghĩ phiên này sẽ rất tuyệt. Nó sẽ là một phiên tốt. Chúng ta sẽ được nghe về nhiều điều khác nhau liên quan đến OpenClaw và các trợ lý AI cá nhân nói chung. Sẽ có các cộng tác viên, người duy trì, đối thủ cạnh tranh và người tạo ra OpenClaw có mặt trên sân khấu. Chúng ta sẽ tiếp tục phiên này cho đến giờ ăn trưa. À, kìa, chúng ta có thể thấy ở đó. Vậy là khoảng một tiếng rưỡi các phiên, các phiên sẽ ngắn hơn một chút so với trước đây. Tôi nghĩ vậy, nhưng chúng ta sẽ bắt đầu với một buổi Hỏi & Đáp (AMA). Bạn đã gặp Peter trước đó, nhưng bạn sẽ có cơ hội đặt câu hỏi, và sẽ có một cuộc trò chuyện giữa Peter và Swix.
Hỏi & Đáp (AMA) với Peter và Swix
Vì vậy, tôi nghĩ để bắt đầu, tôi sẽ mời Swix lên sân khấu để khai mạc. Xin hãy chào đón anh ấy lên sân khấu. Swix, mời anh lên. Swix, bạn có thể cùng lên. Nhưng không có Peter bí mật nào cả. Chào mừng mọi người. Được rồi. Được rồi. Vì vậy, mục đích của phiên này là một buổi Hỏi & Đáp. Ý chính là tôi đã tổ chức sáu sự kiện AI Engineer này. Và bất cứ khi nào chúng ta có một người duy trì lớn, một VIP lớn, chúng ta chỉ cho họ nói chuyện. Nhưng thực ra, các bạn có những câu hỏi muốn hỏi. Vì vậy, chúng tôi muốn tạo cơ hội đó. Bạn có thể gửi câu hỏi tại đây. Tôi sẽ điều phối và tất cả những điều đó. Câu hỏi "gai góc" mà tôi sẽ bắt đầu là, Peter vừa trích lời tôi khi nói, hãy gửi tất cả các câu hỏi của bạn về Closed Claw. Đúng không? Có chuyện gì vậy? Tôi nghĩ mọi người có rất nhiều câu hỏi về tương lai của OpenClaw tại OpenAI. Và tôi muốn dành không gian cho bạn. Mọi người đang nói gì về Closed Claw, và phản hồi của bạn là gì?
Tầm nhìn Mã nguồn Mở của OpenAI
Tôi thậm chí còn không nghĩ về nó. Nó xuất hiện khi tôi quyết định đến OpenAI. Và tôi nghĩ mọi người có lý khi cho rằng OpenAI không phải lúc nào cũng tuyệt vời với mã nguồn mở (Open Source). Và tôi nghĩ rất nhiều điều đã thay đổi. Chẳng hạn, Cortex hiện là mã nguồn mở. Họ đã phát hành Symphony, một tầng orchestration thực sự tuyệt vời. Vì vậy, họ thực sự đang tập trung vào và hiểu mã nguồn mở. Họ hiểu rằng OpenClaw cần phải duy trì tính mở, hoạt động với bất kỳ model nào, dù là của một trong những công ty lớn hay một model cục bộ. Mọi người trong ngành đều thắng nếu có nhiều người dành thời gian với AI. Bạn biết đấy, nếu tôi nghĩ AI là một thứ gì đó đáng sợ, và sau đó đột nhiên tôi chơi OpenClaw này, và đột nhiên nó trở nên vui vẻ và kỳ lạ. Và sau đó tôi đi làm. Và không có, tôi không biết liệu có công cụ AI nào ở nơi làm việc không. Tôi sẽ đến gặp sếp và nói, tại sao chúng ta lại không có AI ở nơi làm việc? Và sau đó các công ty đó có thể sẽ không chạy OpenClaw, nhưng chúng ta muốn một cái gì đó được lưu trữ và quản lý. Và sau đó ai đó có thể bán được hàng. Vì vậy, họ rất ủng hộ. Họ cung cấp cho tôi các nguồn lực. Thực ra là tôi. Tôi có thể có thêm rất nhiều người từ OpenAI để giúp đỡ dự án. Nhưng điều đó sẽ tạo ra một hình ảnh rằng họ có thể đã kiểm soát dự án. Và tôi không muốn điều đó.
Hợp tác và Đa dạng hóa
Vì vậy, tôi đã đưa những người từ NVIDIA vào. Chúng tôi có từ Microsoft, từ Telegram, một người từ Salesforce trong tất cả các công ty. Xin gửi lời chào. Thực ra, có những người tuyệt vời ở Slack. Vì vậy, chúng tôi có một người duy trì plugin của Slack bây giờ. Tôi đã đưa Tencent tham gia, ByteDance. Chúng tôi đã nói chuyện với Alibaba, Minimax, Kimi, tất cả các nhà cung cấp model. Họ rất ủng hộ. NVIDIA đã cực kỳ hữu ích. Họ, tôi nghĩ tôi muốn gọi công ty này là, đây là những kỹ sư thực sự chỉ thuê agent và làm mọi thứ. Và bây giờ tôi có tất cả các công ty khác, tôi cũng đang đưa một vài người từ OpenAI vào để giúp duy trì dự án. Ý tôi là, phần mềm đang thay đổi tốc độ hoạt động của dự án này thật điên rồ. Bạn kiểu như, bạn cần một đội quân. Và tôi đang làm điều đó. Bạn có một đội quân. Nhưng ngay cả biểu đồ đóng góp mà bạn đã cho thấy rằng rất khó để có được những người đóng góp chất lượng cao duy trì. Mọi người cứ thuê người duy trì của bạn. Và sau đó bạn phải tìm những người mới.
Tầm quan trọng của Mô hình Mở và Cục bộ
Vì vậy, có rất nhiều câu hỏi về các mô hình cục bộ và mô hình mở. Không phải mọi phần của stack đều mở. Có nhiều mô hình mà bạn không có quyền truy cập vào chúng. Và những hạn chế kỳ lạ như vậy. Các mô hình mở và cục bộ quan trọng đến mức nào đối với tương lai của OpenClaw? Ý tôi là, một phần động lực khiến tôi xây dựng OpenClaw là, bạn thấy tất cả các công ty lớn này. Và sau đó họ có các connector đến Gmail của tôi. Và sau đó email của tôi được lưu trữ ở đâu đó. Sau đó, công ty này có toàn quyền truy cập vào email của tôi. Và sau đó tôi có thể bị kiểm soát một chút. Hấp dẫn hơn nhiều đối với tôi nếu tôi có tất cả dữ liệu của mình thực sự dưới sự kiểm soát của mình. Và tôi, và giống như một phần nhỏ của nó, sẽ đi lên đó nếu tôi cần mã thông báo cấp cao nhất. Vâng. Và giống như một kiểu phân cấp thứ hai của các mô hình xa hơn. Vâng, bạn muốn, ý tôi là, tôi là người châu Âu trong trái tim mình. Bạn muốn sở hữu dữ liệu của mình. Và cách bạn xây dựng nó. Vì vậy, đối với tôi, điều đó rất hấp dẫn. Và cả thực tế là, bạn biết đấy, nếu bạn là một startup, và bạn muốn kết nối với Gmail, phải mất một năm cà phê. Và đó là một quá trình rất, rất khó khăn. Nhưng nếu tôi là người tiêu dùng, khách hàng của tôi có thể nhấp vào bất kỳ trang web nào. Và vui vẻ nhấp vào, tôi không phải là bot. Nếu bạn phải cung cấp dữ liệu cho tôi bằng cách nào đó, nếu bạn có thể, nếu bạn cung cấp dữ liệu cho tôi, tác nhân của tôi có thể lấy dữ liệu đó. Vì vậy, bạn có thể vượt qua rất nhiều silo mà các công ty lớn đang xây dựng. Và cuối cùng, bạn có thể thực hiện các trường hợp sử dụng tự động hóa thú vị hơn nhiều mà các công ty lớn không bao giờ có thể làm được. Vì vậy, nó giống như một chút bí mật.
Tương lai của GPT OSS và OpenAI
Vâng. Và bất kỳ dấu hiệu nào từ OpenIT về GPT OSS liệu có tiếp tục là một luồng công việc sẽ phù hợp với OpenClaw không? Hay đó là riêng biệt? Tôi không có vị trí để cung cấp cho bạn thông tin chi tiết về điều đó. Chỉ là một phần của yếu tố kích hoạt OpenClaw là ngày càng nhiều người trong công ty đang hào hứng với OpenSource. Và tôi thích rằng OpenAI đang chuyển sang hướng OpenDirection nhiều hơn một lần nữa. Nếu bạn so sánh nó với một số lab hàng đầu khác bắt đầu bằng chữ A, mà rất có thể sẽ kiện bạn nếu bạn làm rò rỉ bất kỳ mã nguồn nào của họ hoặc chặn bạn nếu bạn quá thành công, tôi nghĩ OpenAI đang đi đúng hướng.
Quy trình làm việc Mã hóa và Agent
Vâng. Được rồi, tôi muốn nhấn mạnh câu hỏi này. Mọi người rất thích nghe về quy trình làm việc coding workflow của bạn. Tôi nghĩ đến bây giờ, ý tưởng của bạn về các yêu cầu prompt request thay vì các yêu cầu kéo (pull request) đã được phổ biến rộng rãi. Và bạn cũng đã làm mọi người sốc với cách bạn đang sử dụng mã thông báo tại OpenAI. Về cơ bản, mọi người muốn biết bạn ship (triển khai) như thế nào và bạn làm gì với thời gian chờ của agent. Tại sao bạn lại chạy nhiều agent như vậy? Tôi biết. Tôi chưa bao giờ tưởng tượng rằng bức ảnh đó của tôi lại trở nên nổi tiếng đến vậy. Vâng. Thực ra, nó cung cấp cho chúng tôi những con số chỉ để mọi người nắm được. Tôi nghĩ có những lúc tôi đang chạy gần 10 phiên đồng thời, đặc biệt là khi tôi sử dụng Codex với 5.0, 5.1. Nó khá chậm. Tôi nghĩ bây giờ tôi phải nói rằng, chúng tôi, thật kỳ lạ. Chúng tôi đã cải thiện. Các burst làm cho nó nhanh hơn, và sau đó nó cũng có chế độ nhanh. Vì vậy, đến bây giờ, workflow điển hình của tôi có thể chỉ bằng một nửa, có thể năm, sáu cửa sổ thay vì gấp đôi, chỉ vì mỗi loop nhanh hơn, và area of work tôi nghĩ là trong và workers khá giống nhau. Vì vậy, tôi không cần phải sử dụng chế độ chia đôi màn hình nhiều nữa. Và tôi nghĩ chúng ta sẽ chuyển sang một tương lai nơi mã thông báo sẽ ngày càng nhanh hơn. Đến một lúc nào đó, việc bạn làm việc trên sáu thứ cùng một lúc là không tự nhiên. Nhưng về cơ bản, đó là một giải pháp tạm thời cho đến khi mã thông báo nhanh.
Về "Dark Factory" và Phát triển Lặp lại
Vâng. Một trong những điều thú vị của việc đặt bạn cạnh Ryan là để xem hai bạn tiếp cận việc maxing token như thế nào. Tôi tò mò bạn nghĩ gì về cách tiếp cận "nhà máy tối" (dark factory) hoàn toàn mà bạn thậm chí không xem xét code được đưa vào. Tôi nghĩ điều đó ngày càng khả thi hơn. Nhưng đồng thời, bạn biết đấy, khi tôi, "nhà máy tối" theo một cách nào đó cũng có nghĩa là tôi đưa ra mọi thứ tôi muốn xây dựng ngay từ đầu. Và tôi không nghĩ bạn có thể xây dựng phần mềm tốt theo cách đó. Giống như, con đường lên núi thường không bao giờ là đường thẳng. Nó rất cong. Đôi khi bạn đi chệch đường một chút. Và sau đó bạn thấy một điều gì đó mới mẻ truyền cảm hứng cho bạn. Bạn tìm thấy những con đường tắt. Một khi bạn ở trên đỉnh, bạn có thể tìm thấy con đường tối ưu nhưng bạn không bao giờ làm việc như thế này. Vì vậy, đồng thời, ý tưởng đầu tiên mà bạn có về dự án của mình rất khó có thể là dự án cuối cùng. Nhưng nếu tôi đột nhiên sử dụng waterfall model một lần nữa, đó sẽ là dự án cuối cùng. Đối với tôi, điều đó không hiệu quả. Tôi xây dựng từng bước. Tôi chơi với nó. Tôi xem cảm giác của nó thế nào. Tôi có những ý tưởng mới. Lời nhắc của tôi thay đổi. Vì vậy, đối với tôi, đó là một cách tiếp cận rất lặp lại. Vì vậy, tôi không thấy làm thế nào bạn có thể tự động hóa hoàn toàn điều đó. Bạn chắc chắn có thể xây dựng các pipeline cho một số thứ nhất định. Nhưng ngay cả đối với PR, bạn không chỉ muốn xây dựng một pipeline chỉ hợp nhất PR. Bởi vì rất nhiều trong số đó chỉ không có ý nghĩa. Mọi người sẽ kéo sản phẩm của bạn theo mọi hướng. Nhưng nếu bạn tự động hóa điều đó, tôi sẽ rất khó biết đâu là hướng đi đúng. Bạn có thể hướng dẫn nó. Tôi có một tài liệu vision mà tôi đã thử một số điều đó. Nhưng nút cổ chai vẫn là suy nghĩ. Và giống như có "gu".
Tầm quan trọng của "Gu" trong Phát triển Phần mềm
Vâng, "gu" rất quan trọng. Bạn định nghĩa "gu" như thế nào? Đây là điều mà trong các cuộc trò chuyện của tôi với mọi người, mọi người đều hiểu "gu" là quan trọng nhất. Nhưng không ai đồng ý về "gu" tốt là gì. Vì vậy, tôi tò mò muốn nghe ý kiến của bạn. Tôi nghĩ trong thời đại này, mức độ "gu" rất thấp là nếu nó không "bốc mùi AI". Và bạn biết chính xác ý tôi là gì. Nếu một cái gì đó chỉ là phong cách viết, tính cách, cũng như giao diện người dùng (UI). Nhưng bây giờ bạn đã thấy quá nhiều UI được xây dựng bởi agent mà bạn ngay lập tức biết nếu đó là AI. Nếu nó có viền màu ở bên trái. Vâng, ý tôi là, một thời gian nó giống như public gradient. Nhưng nhiều hơn thế, tôi cảm thấy đó là một cảm giác. Giống như bạn có thể xác định ngay lập tức AI written slop (nội dung AI vô nghĩa/hời hợt). Đó là lý do tại sao tôi nói nó có "mùi". Ngay cả khi bạn không thể chỉ ra nó, bạn sẽ biết. Vì vậy, đó có lẽ là đặc điểm thấp nhất của "gu". Và sau đó tiến xa hơn, bởi vì bây giờ rất nhiều phần mềm có thể tự động hóa được, thực ra bạn có nhiều thời gian hơn để dành cho những chi tiết nhỏ. Tôi biết, bạn biết đấy, khi bạn chạy OpenClaw, bạn nhận được một tin nhắn nhỏ đôi khi "chọc ghẹo" người dùng. Và cũng giống như những chi tiết thú vị, tôi nghĩ, mà bạn sẽ không nhận được nếu bạn prompt ở mức độ cao.
Tính cách và "Linh hồn" cho Chatbot
Vâng. Một trong hai điều tôi yêu thích của bạn là cách bạn thực sự đầu tư rất nhiều công sức vào soul MD của mình. Và bạn đã open source cách tiếp cận của mình. Và tôi không nghĩ mọi người đã làm việc đủ về "linh hồn" cho đến khi bạn xuất hiện. Vì vậy, tôi nghĩ điều đó thực sự thú vị. Tôi có một podcast mà tôi chưa làm xong. Tôi chưa phát hành với Mikhail Parakin, người hiện là CEO của Shopify. Ông ấy là người lãnh đạo Bing, nơi Sydney là chatbot "không liên kết" ban đầu đã xuất hiện. Nhưng tôi nghĩ mọi người thực sự vui vẻ khi "linh hồn" của bạn, chatbot của bạn có cá tính. Clinker của bạn có những nỗi ám ảnh khác nhau. Vâng, đó cũng là vì thế giới đã thay đổi, đúng không? Chúng ta có chat CBD vào năm 2023 và 2004. Và về cơ bản, chúng ta có AI mà không hiểu AI có thể làm gì. Vì vậy, chúng ta đã xây dựng lại Google. Vì vậy, bạn có một trường tìm kiếm và bạn nhận được một phản hồi. Và bạn không mong đợi Google có cá tính. Nhưng bây giờ chúng ta đã chuyển sang tác nhân nhiều hơn, nếu tôi không nghĩ về WhatsApp relay ngay từ đầu và tôi chỉ kết nối nó với Claude Code. Và sau đó khi tôi dùng WhatsApp, tôi nhận thấy rằng nó không đúng lắm. Mặc dù Claude Code đã có một chút cá tính, nhưng nó không thực sự phù hợp với cách mọi người sẽ nhắn tin cho bạn trên WhatsApp. Vì vậy, đó là cách toàn bộ quá trình lặp lại của tôi bắt đầu. Nó giống như, ồ, một lần nữa, đó là về "gu". Nó không đúng lắm. Nó quá dài dòng. Nó dùng quá nhiều dấu chấm.
Triết lý Phát triển OpenClaw
Bạn bè của tôi nhắn tin khác biệt. Và đó là cách tôi bắt đầu làm việc. Họ nói, "Không, cái này không giống như cố gắng viết giống con người hơn." Vâng, tôi thực sự viết giống như một con tôm hùm. Vâng. Một trong những câu nói yêu thích của tôi từ bạn là "sự điên rồ với một chút khoa học viễn tưởng." Đây là cách bạn vận hành các dự án AI.
Và tôi nghĩ không phải tất cả các dự án AI, nhưng đặc biệt là một thứ như OpenClaw sẽ không bao giờ có thể – nó sẽ không thể ra đời từ một công ty Mỹ chỉ vì nó sẽ bị hủy bỏ về mặt pháp lý rất lâu trước khi được phát hành. Bởi vì nó có một số vấn đề mà chúng ta chưa thực sự giải quyết được trong ngành này. Nhưng bây giờ chúng ta có một số biện pháp giảm thiểu và mọi thứ đang tốt hơn. Các mô hình đang ngày càng tốt hơn rất nhiều. Nhưng tôi không hiểu làm thế nào mà bất kỳ phòng thí nghiệm lớn nào có thể phát hành nó. Sẽ có quá nhiều phản đối, không đủ bằng chứng thị trường cho thấy đây là điều mọi người muốn. Vì vậy, nó phải được thực hiện bởi một người bên ngoài.
Vâng. Thực sự, khi tôi xây dựng nó ngay từ đầu, tôi đã nghĩ, "Ôi, điều tồi tệ nhất có thể xảy ra là gì? Nó có thể khai thác mã thông báo của tôi, email của tôi. Không có gì có vẻ như sẽ giết chết tôi hoàn toàn. Nó có thể tải lên một số hình ảnh của tôi." Tôi nghĩ, "Tôi đoán điều tồi tệ nhất đã có sẵn trên mạng, nếu bạn sử dụng Grind." Vì vậy, tôi nghĩ, "Tôi có thể sống với rủi ro đó. Sẽ không thoải mái, nhưng có thể quản lý được." Nếu công ty của bạn rất khác, nó đòi hỏi một cách tiếp cận khác một chút. Vâng. Nhân tiện, đây là tài khoản Instagram [của anh ấy]. Nên theo dõi. Bị đánh giá thấp. Nó cũng có một số nội dung hay.
Tác nhân Phổ Biến và Tương lai của OpenClaw
OK, bạn đang nói về WhatsApp, nói về Telegram, rất nhiều ứng dụng công nghệ này. Ứng dụng nhắn tin tốt. Mọi người cũng đang tìm kiếm yếu tố hình thức tiếp theo. Mọi người muốn kính, tai nghe. Danh sách mong muốn của bạn về việc có các tác nhân trong cuộc sống là gì?
Thực ra tôi đã bắt đầu làm việc đó rồi, nhưng sau đó tôi lại bị sa lầy bởi tất cả những người dùng nó và công việc hàng ngày. Nhưng nếu bạn ở nhà, tôi muốn [tác nhân của mình] có mặt ở bất kỳ phòng nào. Và giống như trong Star Trek, khi bạn nói, "Máy tính, xanh." Tôi muốn nói chuyện với tác nhân của mình mọi lúc mọi nơi. Và nó chỉ cần có thể phản hồi tôi. Nó nên biết tôi đang ở đâu. Tôi có những chiếc iPad nhỏ ở mỗi phòng. Và tác nhân của tôi có thể sử dụng tính năng canvas và chiếu nội dung lên những chiếc iPad đó. Vì vậy, nếu tôi đặt một câu hỏi mà dễ trả lời hơn bằng cách hiển thị cho tôi một thứ gì đó, chẳng hạn như nó có thể sử dụng màn hình gần nhất vì nó biết tôi đang ở đâu. Điện thoại chỉ là một điểm nhập liệu rất tiện lợi, nhưng tôi muốn nói chuyện với nó từ bất cứ đâu. Nếu tôi ở gần và có kính, tôi chỉ cần có thể nghe và chiếu thứ gì đó lên mình. Nhưng chỉ là phổ biến thôi. Tôi hiểu. Vâng, một khi chúng ta có ít nhất một smart home, tác nhân trên điện thoại của bạn, nhưng [tôi] thực sự muốn các tác nhân phổ biến.
Và sau đó bạn muốn, có thể bạn sẽ có OpenClaw chữ in hoa, tác nhân riêng tư của bạn tại nơi làm việc. Bạn có thể có OpenClaw chữ thường. Và sau đó Claw đó có thể nói chuyện với Claw cá nhân của bạn theo cách mà cả công ty của bạn và bạn đều cảm thấy thoải mái. Vì vậy, đó là một kiểu tương lai mà bạn cần phải giải quyết. Vâng. Tôi vừa thực hiện một podcast với Mark và Jason, [những người] hâm mộ lớn, và cũng có những cuộc trò chuyện với Jay Karpathi. Cả hai người này đều đang chạy OpenClaw để quản lý nhà của họ. Và tôi nghĩ OpenClaw cho gia đình là một [tính năng] có vẻ bị đánh giá thấp, nhưng mọi người thực sự đang khám phá nó. Và điều trớ trêu hài hước nhất của tôi là nó chỉ có thể thực hiện được bởi vì "internet of shit" có nghĩa là hầu hết các thiết bị thông minh đều rất tệ về bảo mật, điều đó có nghĩa là OpenClaw có thể chạy chúng. Nó sẽ tốt hơn rất nhiều trong vài tháng tới, ngay cả khi các mô hình [bảo mật] đang trở nên rất kém. Vâng, [các mô hình LLM] chúng rất tốt.
Giải quyết Vấn đề Prompt Injection
OK, một câu hỏi bảo mật về prompt injection. Bạn muốn giải quyết prompt injection như thế nào? Hoặc bạn đã suy nghĩ về vấn đề prompt injection bằng những cách nào? Có lẽ vẫn chưa đủ. Mặt khác, mô hình phía trước thực sự khá tốt trong việc phát hiện tất cả các trường hợp khi nội dung ngẫu nhiên đến từ một trang web hoặc email; đó thường không còn là vấn đề nữa. Nội dung của bạn được đánh dấu là không đáng tin cậy. Rất khó để trích xuất dữ liệu từ đó. Nếu tôi có quyền truy cập không giới hạn vào Claw của bạn và có thể bắn phá nó bằng các nội dung, thì vẫn có cơ hội. Vẫn có cơ hội. Nhưng đối với một số thứ, đó không còn là vấn đề lớn nhất. Nếu bạn sử dụng [điều đó], đó cũng là lý do tại sao bạn biết rằng đây có lẽ là góc nhìn mà một số người nói, "Ồ, Peter không thích các mô hình cục bộ." Nhưng sau đó tôi thấy mọi người đang chạy một mô hình 20 tỷ tham số mà chỉ làm bất cứ điều gì bạn bảo nó, và nó không được huấn luyện để có bất kỳ biện pháp phòng thủ nào cả. Điều đó vẫn còn có vấn đề. Nếu bạn chạy nó và sau đó bạn sử dụng trình duyệt web hoặc email, tôi sẽ lo lắng. Đó là lý do tại sao OpenClaw cảnh báo bạn nếu bạn sử dụng một mô hình nhỏ. Và sau đó mọi người tạo ra một câu chuyện như, "Tôi thích việc nó sẽ hỗ trợ mọi thứ." Nhưng bạn phải hướng người dùng thông thường một chút theo một hướng để làm cho họ khó tự gây hại cho mình hơn. Vâng, có một số ý tưởng cho prompt injection. Nó vẫn còn một chặng đường dài. Tôi có nhiều hơn [một] câu trả lời. Tôi nghĩ Simon Willison đã làm việc rất nhiều về vấn đề này. Ông ấy đã đặt ra thuật ngữ prompt injection, và cách tiếp cận LLM kép có vẻ thông minh. Và tôi không đủ thông minh để tìm ra tất cả các cách mà nó có thể bị tấn công. Đến một lúc nào đó, sự tin cậy phải là một điều gì đó. Một điều thú vị mà tôi phát hiện ra khi nói chuyện với Vincent, người sẽ nói chuyện tiếp theo, là các bạn phải triển khai cùng một hệ thống tin cậy mà Toby đã phải triển khai, đó là: bạn xây dựng danh tiếng theo thời gian, và những thứ có độ tin cậy cao hơn sẽ có quyền truy cập đặc quyền hơn. Tôi nghĩ điều đó có lý. Đó là một phần của câu chuyện.
Dự án Tương lai và Khái niệm "Dreaming"
Được rồi. Vậy, có một số câu hỏi rộng hơn. Bạn muốn làm những dự án thú vị nào khi có nhiều thời gian rảnh hơn? Ý tôi là, tôi muốn làm việc về dreaming. Và tôi thích [việc] những người bảo trì của tôi đã làm việc về dreaming khi tôi ở đó, giống như để dreaming. Cách bạn đã dreaming. Đại loại như vậy. Bạn nói đúng không? Vâng. Dreaming là gì? Nó giống như một cách để hòa giải các ký ức và tôi tạo ra một chút giống như một nhật ký giấc mơ. Nó đi qua các nhật ký phiên làm việc của bạn. Chúng tôi phát hiện ra từ rò rỉ mã nguồn của Anthropic rằng họ cũng đang làm việc về dreaming. Ý tôi là, có nhiều công ty đang làm việc về điều đó. Nhưng hãy nghĩ một chút về cách chúng ta học hỏi với tư cách con người? Bạn trải nghiệm rất nhiều điều trong ngày, và sau đó bạn ngủ. Trong giấc ngủ, bộ não của bạn giống như một bộ thu gom rác, chuyển đổi một số ký ức được lưu trữ cục bộ thành bộ nhớ dài hạn và loại bỏ những ký ức khác. Và đó là những ý tưởng tương tự mà tôi nghĩ cũng có thể rất hữu ích cho các tác nhân. Và sau đó, điều chúng ta nên làm là dreaming là bước nhỏ đầu tiên theo hướng đó. Nó liên quan đến việc wiki mà Andre đã nói về việc bạn thu thập mọi thứ vào một... Đây là nhiều memory hơn, nhưng mọi thứ hòa quyện vào nhau. Vẻ đẹp của OpenClaw là chúng ta có thể thử nghiệm mọi thứ. Chẳng hạn, mọi thứ chúng tôi đã làm việc trong vài tháng qua là ban đầu nó là một mớ cơ sở mã spaghetti khổng lồ. Và bây giờ mọi thứ đều là một extension, một plugin. Vì vậy, bạn có thể thay thế memory, bạn có thể thêm wiki, bạn có thể thêm dreaming, bạn có thể thêm, tôi không biết, bất cứ ý tưởng điên rồ nào bạn có và biến nó thành của riêng bạn. Bạn không cần phải gửi mọi thứ đến một pull request vì chúng tôi vẫn hoàn toàn quá tải với việc này. Nhưng nó giống như Linux hơn, nơi bạn có thể tự cài đặt các thành phần của riêng mình.
OpenClaw như Mã nguồn mở Quan trọng nhất kể từ Linux
Vâng. Và bạn đang xây dựng thứ mà nhiều người cho là mã nguồn mở có ý nghĩa nhất kể từ Linux. Mà tôi không biết bạn đối phó với điều đó như thế nào. Bạn làm gì với danh tiếng? Một ngày của bạn với tư cách là BDFL thực tế của một dự án như thế này diễn ra như thế nào?
Chà, vẫn còn rất nhiều việc lập trình. Cũng có rất nhiều... Nhân tiện, giữa các phiên anh ấy vẫn đang lập trình. Kiểu như thế. Vâng, họ rất hào hứng với mã thông báo. Bạn phải thích một cái gì đó khác để có thể thúc đẩy các tác nhân, đúng không? Vâng. Chúng tôi đã được trang bị một chút. Giờ đây, việc nói chuyện và định hướng mọi người đúng hướng chiếm nhiều thời gian hơn. Bởi vì có rất nhiều điều chúng tôi đã học được tại OpenClaw. Vì vậy, một phần vai trò của tôi tại OpenClaw là giúp đỡ và không lặp lại những sai lầm tương tự. Và tại OpenClaw, việc thử những điều mới mẻ có vẻ thú vị, và một số có thể hiệu quả và một số có thể không. Chúng tôi cho phép các công ty xây dựng Claw của riêng họ mà không cần phải fork đi, mà làm cho mọi thứ trở nên tùy biến hơn. Vâng, đôi khi tôi ngủ. Đôi khi bạn ngủ. Được rồi, tuyệt vời.
Kỹ năng Quan trọng cho Kỹ sư trong Kỷ nguyên AI
Tôi nghĩ đây có lẽ là những câu hỏi kết thúc hay cuối cùng. Bạn muốn con người và đặc biệt là các kỹ sư tập trung phát triển những kỹ năng nào trong kỷ nguyên AI? Trường hợp thiết kế hệ thống là một vấn đề lớn, nhưng tôi đã đề cập đến rồi. Thiết kế hệ thống vẫn rất quan trọng. Vâng, chúng ta đã nói về điều này theo các khía cạnh... Vâng, nếu tôi cứ tiếp tục. Vâng. Nếu bạn không nghĩ về điều đó, bạn cuối cùng sẽ tự đẩy mình vào ngõ cụt, chỉ bằng cách xác định các ranh giới. Điều buồn cười là, mọi thứ đều nằm trong Claw, nhưng bạn vẫn cần đặt đúng câu hỏi. Nếu không, điều đó tạo ra sự khác biệt giữa mã nguồn tốt hoặc mã nguồn thực sự tệ được tạo ra. Và đó vẫn là nơi mà tất cả kiến thức bạn có, như cách bạn xây dựng phần mềm, bạn có thể áp dụng để định hướng tác nhân tạo ra thứ không phải là AI Slop.
Và tôi nghĩ một kỹ năng đang trở nên ngày càng quan trọng là nói không. Và đó là điều tôi cũng phải học, bởi vì ngay cả ý tưởng điên rồ nhất cũng chỉ cách một lời nhắc mà thôi. Và thường thì một ý tưởng này không bao giờ là vấn đề, nhưng ý tưởng này và ý tưởng này và ý tưởng này, và sau đó tất cả những điều đó khớp với nhau như thế nào – đó mới là vấn đề. Vì vậy, tôi nghĩ chúng ta vẫn đang bị tắc nghẽn ở tư duy và tư duy tổng thể. Vâng. Bởi vì hãy tưởng tượng thế giới từ Claw của bạn. Giống như bạn bị ném vào một cơ sở mã, bạn có thể có một DF của tác nhân đã lỗi thời, nhưng về cơ bản bạn không biết DF là gì. Và sau đó bạn nói với tôi, "Này, hãy thêm hồ sơ người dùng." Và bằng cách nào đó hồ sơ người dùng được kết nối với hai điều bạn thấy, nhưng bạn không thấy toàn bộ hệ thống, đúng không? Và đó là nơi mà rất nhiều giải pháp cục bộ đó xuất hiện. Nơi dự án có [vấn đề], và công việc của chúng ta là giúp tác nhân làm việc tốt nhất có thể, nhưng [cũng] cung cấp cho họ những gợi ý: "Này, bạn có muốn xem xét điều này không? Bạn có muốn nhìn vào đó không? Điều này sẽ tương tác với điều kia như thế nào?" Và cuối cùng bạn sẽ có một trợ lý tốt hơn nhiều mà thực sự có thể bảo trì được. Vâng.
Vâng, cảm ơn bạn đã duy trì một trong những phần mềm quan trọng nhất mọi thời đại, và cảm ơn bạn đã dành thời gian cho chúng tôi. Cảm ơn vì đã mời tôi. Vâng. Hy vọng bạn sẽ ở lại và đặt câu hỏi. Cảm ơn.
TL;DR
- OpenClaw, dự án AI mã nguồn mở đang phát triển nhanh nhất thế giới, đối mặt với thách thức lớn về quản lý tăng trưởng thần tốc và xử lý hàng nghìn cảnh báo bảo mật, nhiều trong số đó là do AI tạo ra và không thực sự nghiêm trọng.
- Ngành công nghiệp đang tồn tại một xu hướng "kích động nỗi sợ hãi" và thông tin sai lệch về mức độ "không an toàn" của các tác nhân AI, bỏ qua các khuyến nghị bảo mật quan trọng như cô lập môi trường và hạn chế quyền truy cập.
- Peter Steinberger gia nhập OpenAI nhưng vẫn duy trì OpenClaw Foundation, với sự hỗ trợ từ OpenAI và các công ty công nghệ lớn, nhằm đảm bảo dự án luôn mở, dễ tiếp cận và phát triển bền vững để thúc đẩy hiểu biết về AI trong cộng đồng.
Điểm chính
- OpenClaw đã trải qua mức độ tăng trưởng chưa từng có trên GitHub, được mô tả là "Stryper Pole" thay vì "hockey stick", đạt hàng chục nghìn commit và gần 2.000 contributors chỉ trong 5 tháng.
- Quản lý một dự án mã nguồn mở lớn với tình nguyện viên rất khó khăn, giống như điều hành một công ty ở chế độ khó; mục tiêu là cải thiện "bus factor" bằng cách đa dạng hóa đội ngũ đóng góp.
- Dự án nhận được một lượng lớn cảnh báo bảo mật (trung bình 16,6 cảnh báo/ngày), gấp đôi so với Linux kernel, nhưng nhiều trong số đó bị đánh giá là "AI Slop" hoặc phóng đại mức độ nghiêm trọng.
- Các vấn đề bảo mật thường phát sinh từ việc người dùng không tuân thủ khuyến nghị cài đặt an toàn, như chạy tác nhân ở "sudo mode" hoặc không sử dụng môi trường biệt lập (sandboxing).
- Các "hệ thống tác nhân" (agent systems) nói chung đều có rủi ro nếu chúng có quyền truy cập vào dữ liệu nhạy cảm, nội dung không đáng tin cậy và khả năng giao tiếp, không chỉ riêng OpenClaw.
- Việc sàng lọc các báo cáo bảo mật do AI tạo ra là một gánh nặng lớn về thời gian và đòi hỏi chuyên môn của con người, vì các báo cáo này thường không kèm theo bản vá chất lượng.
- OpenClaw Foundation được thành lập với sự hỗ trợ từ OpenAI và các đối tác như NVIDIA, Microsoft, Red Hat, Tencent, ByteDance để đảm bảo tính mở, cung cấp tài nguyên và thuê nhân sự toàn thời gian, giải phóng nhà sáng lập cho các công việc đổi mới.
- OpenAI hỗ trợ OpenClaw vì nhận thấy giá trị của việc tăng cường tiếp xúc cộng đồng với AI mã nguồn mở, giúp mọi người hiểu cả rủi ro lẫn tiềm năng của công nghệ này.
Từ vựng
AI— Trí tuệ nhân tạotác nhân— agentStryper Pole— tăng trưởng kiểu Stryper Pole (tăng trưởng rất nhanh, gần như thẳng đứng)bus factor— yếu tố xe buýt (mức độ phụ thuộc vào một cá nhân)môi trường biệt lập— sandboxed environment / isolated environmentmô hình— model (AI model)thực thi mã từ xa (RCE)— Remote Code Executionchuỗi cung ứng— supply chainAI Slop— nội dung AI vô nghĩa/hời hợtmã nguồn mở (Open Source)— open source
Nội dung chi tiết
Giới thiệu và Tăng trưởng của OpenClaw
Diễn giả tiếp theo của chúng ta là người sáng lập OpenClaw, dự án AI mã nguồn mở phát triển nhanh nhất thế giới. Gần đây, anh ấy đã gia nhập OpenAI để tập trung vào việc đưa các tác nhân đến với mọi người. Xin mời cùng chào đón Peter Steinberger lên sân khấu.
Chào buổi sáng mọi người, Swiss đã yêu cầu tôi trình bày về tình hình của OpenClaw. Ai ở đây đang chạy OpenClaw? Xin giơ tay. Khoảng 30% hoặc 40%. Rất tốt. Vâng, đã vài tháng trôi qua. Dự án hiện đã 5 tháng tuổi. Tôi nghĩ có thể nói rằng chúng tôi là dự án phát triển nhanh nhất trong lịch sử GitHub. Nếu bạn đã xem biểu đồ, một số dự án trông giống như gậy hockey stick, nhưng của chúng tôi thì giống như một đường thẳng đứng, thậm chí có người gọi đó là tăng trưởng kiểu Stryper Pole.
Thử thách của Tăng trưởng Nhanh và Quản lý Tổ chức
Và điều đó đi kèm với những thách thức riêng. Hiện tại, tôi nghĩ chúng tôi có số lượng GitHub stars lớn nhất. Có một vài dự án lớn hơn, nhưng xét về mục tiêu giáo dục cơ bản, không có dự án phần mềm nào khác lớn đến vậy. Dự án có khoảng 30.000 commits, chúng tôi sắp đạt 2.000 contributors và sẽ sớm có 30.000 pull request (PR). Chúng tôi không hề chậm lại. Bạn có thể thấy đó là một đà tăng trưởng mạnh mẽ, và hôm nay mới là ngày 9 tháng 4, nên tốc độ vẫn đang rất tốt.
Đồng thời, mọi thứ không hề dễ dàng. Tôi đã có hai lựa chọn khi quyết định mình muốn làm gì. Tôi đã làm việc theo mô hình công ty rồi, và tôi không muốn làm lại điều đó. Sau đó tôi gia nhập OpenAI, nhưng chúng tôi cũng thành lập OpenClaw Foundation. Giờ đây, tôi có hai công việc. Điều hành quỹ giống như điều hành một công ty ở chế độ khó, vì bạn phải lo tất cả mọi thứ, nhưng lại có rất nhiều tình nguyện viên mà bạn không thể thực sự chỉ đạo được. Vì vậy, một trong những mục tiêu của tôi là cải thiện bus factor – tức là ai sẽ là người thực hiện các commit. Và bạn thấy rằng tình hình đang dần được cải thiện. Vincent sẽ nói chuyện sau tôi. Nhưng anh ấy vẫn chưa thể đảm nhận toàn bộ.
Trong những tháng gần đây, tôi đã nói chuyện với rất nhiều công ty. Hiện chúng tôi có người của NVIDIA tham gia, có người từ Microsoft để hỗ trợ về MS Teams và ứng dụng Windows. Chúng tôi có người từ Red Hat, người đã giúp chúng tôi rất nhiều về bảo mật và tài liệu. Chúng tôi hợp tác với nhiều công ty Trung Quốc; có người từ Tencent và ByteDance. Họ thực sự là những người dùng lớn hơn bất kỳ châu lục nào khác. Và có người từ khắp nơi trên thế giới.
Bối cảnh An ninh của OpenClaw
Nhưng điều chính mà tôi muốn nói một chút là về OpenClaw, một dự án "không an toàn". Bạn biết đấy, bạn đã thấy các meme. OpenClaw "mời gọi những kẻ xấu". Và bạn có lẽ đã thấy các công ty như NVIDIA làm NemoClaw và mỗi người đều có "những con tôm hùm" của riêng họ. Bạn cũng nhận thấy rằng trong hai hoặc ba tháng qua, có rất nhiều bản phát hành mà mọi thứ bị hỏng. Tôi về cơ bản đã bị choáng ngợp bởi các cảnh báo bảo mật. Đó là những gì tôi đã làm và tập trung vào.
Cho đến nay, chúng tôi nhận được 1.142 cảnh báo. Con số đó khoảng 16,6 cảnh báo mỗi ngày. 99 trong số đó là cực kỳ nghiêm trọng. Chúng tôi đã công bố khoảng 469 cảnh báo và đã đóng 60% trong số đó. Những con số này nghe có vẻ cực kỳ đáng sợ. Nếu bạn so sánh nó, ví dụ, với các dự án lớn khác, như Linux kernel nhận được khoảng tám hoặc chín cảnh báo mỗi ngày. Chúng tôi nhận được gấp đôi. Curl có 600 báo cáo. Chúng tôi có gấp đôi Curl.
Mỗi khi tôi nhận được một sự cố bảo mật, quy tắc là: ai càng la hét về mức độ nghiêm trọng, thì càng có khả năng đó là AI Slop (nội dung vô nghĩa/hời hợt). Như chúng ta có lẽ cũng đã thấy tin tức, chúng ta đang nhanh chóng tiến vào một thế giới mà chúng ta phải thay đổi cách phát triển phần mềm, bởi vì tất cả các công cụ AI này đang trở nên rất giỏi trong việc xác định ngay cả những exploit đa chuỗi kỳ lạ nhất, và chúng ta sẽ làm hỏng tất cả phần mềm hiện có.
Tôi sẽ đưa ra một ví dụ: NVIDIA đã ra mắt NemoClaw, và NemoClaw là một plugin và lớp bảo mật cho OpenClaw, được đặt trong một môi trường biệt lập. Bài phát biểu chính diễn ra vào thứ Hai, họ đã mời tôi vào Chủ Nhật để làm việc cùng. Tôi đã kết nối nó với bảo mật mã nguồn. Nó đã tìm thấy khoảng năm cách khác nhau để thoát khỏi môi trường biệt lập an toàn của họ chỉ trong nửa giờ. Điều đó là do nếu bạn sử dụng sản phẩm đó, bạn sẽ có quyền truy cập vào mô hình nền tảng thông minh hơn đáng kể về mặt an ninh mạng so với những gì công chúng có thể truy cập, chính xác là vì nó nguy hiểm.
Nhưng vâng, toàn bộ ngành công nghiệp này, đối với những người đó, nó giống như điểm thưởng phải không? Càng tìm thấy nhiều lỗi, họ càng được chú ý. Vì vậy, OpenClaw giống như sản phẩm "không an toàn" mà mọi người đều cố gắng bẻ khóa. Vì vậy, theo đúng nghĩa đen là hàng trăm người đã khởi động các công cụ của họ để cố gắng bẻ khóa OpenClaw. Bề mặt tấn công điển hình là thực thi mã từ xa (Remote Code Execution - RCE), bỏ qua phê duyệt, tiêm mã (code injection), lỗ hổng mật khẩu. Nghe có vẻ rất nguy hiểm.
Xử lý Lỗ hổng Bảo mật: Ví dụ CVSS 10
Tôi sẽ cung cấp cho bạn một ví dụ cụ thể. GHSA-4GP, đây là một vấn đề có điểm CVSS là 10, nghĩa là nó là điều đáng sợ nhất mà bạn có thể gặp phải. Đây là một vấn đề mà nếu bạn đồng bộ hóa, ví dụ, ứng dụng iPhone mà chúng tôi thậm chí còn chưa phát hành, nhưng đang trong quá trình phát triển, và bạn chỉ cấp cho nó quyền đọc, thì bạn có thể bẻ khóa hệ thống để cũng có được quyền ghi. Lỗi này nghiêm trọng đến mức... Tôi không biết, lỗi này thực sự khác biệt về mặt thực tế. Nó thậm chí không phải là một sự cố vì trường hợp sử dụng điển hình là bạn cài đặt nó trên máy của mình, dù là trên đám mây hay trên Mac Mini (tôi đã ngừng đấu tranh với điều này, bây giờ tôi chỉ để mọi người vui vẻ thôi). Nhưng trong 99,99% các trường hợp, bạn sẽ có quyền truy cập vào gateway của mình hoặc bạn sẽ không có quyền truy cập vào gateway đó.
Để tự bào chữa, đây là lỗi của tôi khi tôi cố gắng tạo ra một mô hình linh hoạt hơn. Ví dụ, nếu bạn có các thiết bị hướng đến lời nói, và sau đó chúng tôi chỉ muốn đọc một số thứ nhất định, thì có một số trường hợp sử dụng mà một hệ thống quyền hạn giảm thiểu có thể có ý nghĩa. Nhưng không ai sử dụng điều đó. Nhưng điều này không quan trọng vì các quy tắc về cách bạn tạo ra các số CVSS không đóng góp vào điều đó chút nào. Và tôi đã cố gắng tuân thủ các quy tắc. Vì vậy, nó là một lỗi 10/10 và cả thế giới đang phát cuồng vì những sự cố mà trên thực tế không ảnh hưởng đến mọi người.
Tấn công Từ bên Ngoài và Chuỗi Cung ứng
Có một số vấn đề khác thực sự ảnh hưởng đến mọi người. Chúng tôi có các quốc gia đang cố gắng tấn công người dùng. Có GhostClaw, có khả năng đến từ Triều Tiên, về cơ bản là gây nhầm lẫn cho mọi người bằng một npm package khác. Và nếu bạn truy cập một trang web sai và cố gắng tải xuống, bạn sẽ nhận được một rootkit. Điều đó nằm ngoài tầm kiểm soát của chúng tôi. Điều đó cũng xảy ra với những người khác.
Ngoài ra, còn có vấn đề với Axios, điều thú vị là chúng tôi không sử dụng Axios. Nhưng chúng tôi đang sử dụng MS Teams hoặc Slack như một dependency (thành phần phụ thuộc). Và chúng sử dụng Axios và đã không pin phiên bản phụ thuộc của chúng. Và tất nhiên, vì đó là cách các cuộc tấn công chuỗi cung ứng hoạt động, chúng tôi cũng bị ảnh hưởng.
Làm thế nào để bạn sống sót? 1.142 [báo cáo], tôi chắc rằng sẽ lên 2.050. Trong một thời gian, tôi đã cố gắng tự mình xử lý vòng lặp này, điều đó hoàn toàn không thể. Vì vậy, cách nhanh nhất để nhận được sự giúp đỡ là nhận được sự giúp đỡ từ các công ty. Và NVIDIA đã thực sự tuyệt vời khi cung cấp cho chúng tôi một số người về cơ bản làm việc toàn thời gian, xem xét các AI Slop và củng cố cơ sở mã.
Đối phó với Kích động Nỗi Sợ hãi và Thông tin Sai lệch
À, còn một góc độ khác nữa. Góc độ còn lại là có rất nhiều công ty đang kích động nỗi sợ hãi. Và không chỉ các công ty, mà cả các trường đại học nữa. Tôi không biết bạn có thấy không, có một bài báo đã gây xôn xao, "Agents of Chaos" (Các tác nhân của hỗn loạn). Và họ nói, đó là về các tác nhân nói chung, nhưng sau đó có bốn trang giải thích kiến trúc OpenClaw một cách chi tiết nhất. Nhưng bạn biết trang nào họ thậm chí còn không đề cập đến không? Đó là trang bảo mật nơi chúng tôi giải thích cách bạn nên cài đặt nó. Bởi vì khi đó sẽ không vui, khi đó sẽ không... Sẽ khó tạo ra một câu chuyện hấp dẫn. Vì vậy, thay vào đó, họ đã bỏ qua tất cả các khuyến nghị chúng tôi đưa ra về bảo mật.
Khuyến nghị là: đây là tác nhân cá nhân của bạn. Đừng đặt nó vào một nhóm chat. Nếu bạn đặt nó vào một nhóm chat, hãy bật môi trường biệt lập lên. Bởi vì nếu bất kỳ ai cũng có thể nói chuyện với tác nhân của bạn, họ có thể khai thác nó cho bất cứ điều gì mà tác nhân đó có thể làm. Vì vậy, nếu đó là tác nhân nhóm, nó chỉ nên biết những gì nhóm có thể biết và không có bất kỳ dữ liệu bí mật nào. Và bạn có lẽ muốn hạn chế nó. Nếu đó là tác nhân cá nhân của bạn, bạn nên là người duy nhất có thể nói chuyện với nó.
Nhưng nếu bạn không tuân thủ các quy tắc, bạn có thể nhận được một số tương tác thực sự "thú vị". Giống như, này, tôi có thể nói chuyện với tác nhân của bạn và nó có thể phá vỡ hệ thống của bạn. Và sau đó, bởi vì tôi đã chất vấn họ một chút vì tôi có một số câu hỏi, "các bạn làm việc đó như thế nào?" Họ nói với tôi, ồ vâng, không, chúng tôi chạy nó ở chế độ sudo mode bởi vì chúng tôi muốn tác nhân hoạt động mạnh mẽ nhất có thể. Vì vậy, họ thực sự nghĩ rằng họ đã thiết lập... Thực ra không dễ để chạy nó ở chế độ sudo mode, bạn phải thay đổi mã nguồn. Nhưng họ không đề cập đến điều đó trong báo cáo vì một lần nữa, điều đó sẽ không mang lại cho họ uy tín.
Vì vậy, sự thất vọng hiện tại của tôi là: có cả một ngành công nghiệp cố gắng đặt dự án vào một ánh sáng tiêu cực. Nó là một cơn ác mộng. Nó không an toàn theo mặc định. Nó không thể chấp nhận được. Và trong khi đó, rất nhiều người yêu thích nó. Và những người thực sự đọc tài liệu bảo mật sẽ hiểu và có thể sử dụng nó một cách ổn thỏa.
Ba Yếu tố Rủi ro Chí tử của Hệ thống Tác nhân
Một ví dụ mà tôi thấy đặc biệt tuyệt vời là chúng tôi đã có một RCE (thực thi mã từ xa) đã gây hoảng loạn ở Bỉ. Cục an ninh mạng Bỉ đã phát hành một thông báo về môi trường thực thi mã từ xa. Và toàn bộ lỗi là một tính năng mà một trang web độc hại có thể tạo một liên kết sẽ kích hoạt gateway và sau đó chuyển tiếp mã thông báo gateway của bạn.
Bây giờ, nếu bạn sử dụng thiết lập mặc định và được khuyến nghị, mã thông báo gateway chỉ có hiệu lực cục bộ. Hoặc nếu cần, nó nằm trong mạng riêng của bạn. Không có trang web bên ngoài nào thực sự có thể truy cập nó. Nếu bạn chủ động chống lại thiết lập này, ví dụ, bạn sử dụng triển khai đám mây để thiết lập nó mà không đọc tài liệu, bạn có thể khiến thiết lập đó hoạt động. Nhưng một lần nữa, điều đó không giống như những gì được nêu trên trang web.
Thành thật mà nói, vâng, hoàn toàn có rủi ro. Rủi ro lớn là, về cơ bản, bộ ba yếu tố chí tử. Bất kỳ hệ thống tác nhân nào có quyền truy cập vào dữ liệu của bạn, có quyền truy cập vào nội dung không đáng tin cậy và khả năng giao tiếp đều có nguy cơ tiềm ẩn. Đó không phải là điều gì đặc biệt của OpenClaw. Giống như bất kỳ tác nhân nào, bất kỳ hệ thống AI mạnh mẽ nào cũng có vấn đề. Bạn càng làm cho nó mạnh mẽ, nó càng có thể làm nhiều việc cho bạn. Nhưng bạn cũng càng phải hiểu nó đang làm gì. Vì vậy, đây là vấn đề chính. Nhưng mọi người không nói về nó.
Gánh nặng Báo cáo An ninh do AI Tạo ra
Vâng, và sau đó là một phần về việc duy trì. Vấn đề là nếu bạn nhận được tất cả các cảnh báo bảo mật đó, bạn biết rằng hầu hết chúng được tạo ra bằng tác nhân AI. Nhưng bạn vẫn phải sử dụng trí óc của mình để thực sự đọc chúng vì chúng ta chưa đến mức có thể hoàn toàn tin tưởng, hoặc tôi chưa đến mức có thể hoàn toàn tin tưởng rằng tác nhân sẽ tự mình tìm ra vấn đề. Vì vậy, đó là một gánh nặng lớn về thời gian.
Đôi khi bạn có thể đoán được. Bất cứ khi nào báo cáo quá tử tế hoặc ai đó xin lỗi, rất có thể đó là AI, bởi vì thông thường mọi người quá thiếu tự tin để không xin lỗi. Nhưng đó là một vấn đề lớn. Và đó là điều mà tôi thấy ngày càng nhiều dự án OpenClaw than phiền, như việc gây ra các lỗi. Một số rất công khai về điều đó, như FFmpeg.
Thông thường bạn chỉ nhận được báo cáo. Rất hiếm khi thực sự nhận được một báo cáo kèm theo một bản vá. Nếu bạn nhận được báo cáo kèm theo bản vá, đó thường là một bản vá rất tệ. Nếu bạn vội vàng, như tôi đôi khi đã làm lúc ban đầu vì quá tải, bạn chắc chắn sẽ làm hỏng sản phẩm. Vì vậy, đây là điều rất khó để thực hiện chỉ với các tình nguyện viên.
Tầm nhìn Tương lai: OpenClaw Foundation và OpenAI
Vậy chúng ta đang làm gì? Điều số một là, mọi người nói rằng OpenAI đã mua OpenClaw. Điều đó không đúng. Họ có thể đã mua linh hồn tôi thật. Nhưng họ rất hiểu rằng để thế giới cần gì, đó là nhiều người hơn chơi với Trí tuệ nhân tạo để hiểu Trí tuệ nhân tạo có thể làm gì, để cả hiểu rủi ro và cả những khả năng.
Họ hiểu rằng nếu bạn, hoặc một người chưa từng chơi, chưa từng sử dụng Trí tuệ nhân tạo, đột nhiên ở nhà và sử dụng OpenClaw, họ sẽ đến nơi làm việc. Và họ sẽ hỏi, "Tại sao chúng ta không có Trí tuệ nhân tạo ở nơi làm việc?" Vì vậy, họ rất hiểu rằng việc hỗ trợ dự án này rất hữu ích. Và để dự án đó thành công, nó không thể nằm dưới sự kiểm soát của một công ty duy nhất. Do đó, tôi đang xây dựng một "Thụy Sĩ" với OpenClaw Foundation. Và tôi có David giúp tôi. Nó gần như đã hoàn thành.
Tình hình tài chính và Hướng đi của OpenClaw
Thứ duy nhất đang giữ chúng tôi tiếp tục là hệ thống ngân hàng Mỹ, vốn khá chậm và rất khó hiểu khi bạn không phải là người Mỹ. Nó được lấy cảm hứng từ những gì Gosti đã làm. Điều này thực sự sẽ giúp chúng tôi thuê thêm nhân sự toàn thời gian để vừa duy trì tốc độ, vừa cải thiện chất lượng. Nó cũng sẽ giải phóng một phần thời gian của tôi để tôi có thể tiếp tục làm những điều thú vị. Và cập nhật đôi chút về tình hình Claw. Tôi sẽ có mặt sau cho phần Hỏi & Đáp. Cảm ơn đã lắng nghe. Được rồi. Tuyệt vời. Cảm ơn vì tiếng hô. Yêu thích tiếng hô đó.
Giới thiệu phiên Breakout Claw
Được rồi, bạn đã chọn chủ đề Claw để bắt đầu các phiên thảo luận chuyên sâu của chúng ta. Tôi nghĩ phiên này sẽ rất tuyệt. Nó sẽ là một phiên tốt. Chúng ta sẽ được nghe về nhiều điều khác nhau liên quan đến OpenClaw và các trợ lý AI cá nhân nói chung. Sẽ có các cộng tác viên, người duy trì, đối thủ cạnh tranh và người tạo ra OpenClaw có mặt trên sân khấu. Chúng ta sẽ tiếp tục phiên này cho đến giờ ăn trưa. À, kìa, chúng ta có thể thấy ở đó. Vậy là khoảng một tiếng rưỡi các phiên, các phiên sẽ ngắn hơn một chút so với trước đây. Tôi nghĩ vậy, nhưng chúng ta sẽ bắt đầu với một buổi Hỏi & Đáp (AMA). Bạn đã gặp Peter trước đó, nhưng bạn sẽ có cơ hội đặt câu hỏi, và sẽ có một cuộc trò chuyện giữa Peter và Swix.
Hỏi & Đáp (AMA) với Peter và Swix
Vì vậy, tôi nghĩ để bắt đầu, tôi sẽ mời Swix lên sân khấu để khai mạc. Xin hãy chào đón anh ấy lên sân khấu. Swix, mời anh lên. Swix, bạn có thể cùng lên. Nhưng không có Peter bí mật nào cả. Chào mừng mọi người. Được rồi. Được rồi. Vì vậy, mục đích của phiên này là một buổi Hỏi & Đáp. Ý chính là tôi đã tổ chức sáu sự kiện AI Engineer này. Và bất cứ khi nào chúng ta có một người duy trì lớn, một VIP lớn, chúng ta chỉ cho họ nói chuyện. Nhưng thực ra, các bạn có những câu hỏi muốn hỏi. Vì vậy, chúng tôi muốn tạo cơ hội đó. Bạn có thể gửi câu hỏi tại đây. Tôi sẽ điều phối và tất cả những điều đó. Câu hỏi "gai góc" mà tôi sẽ bắt đầu là, Peter vừa trích lời tôi khi nói, hãy gửi tất cả các câu hỏi của bạn về Closed Claw. Đúng không? Có chuyện gì vậy? Tôi nghĩ mọi người có rất nhiều câu hỏi về tương lai của OpenClaw tại OpenAI. Và tôi muốn dành không gian cho bạn. Mọi người đang nói gì về Closed Claw, và phản hồi của bạn là gì?
Tầm nhìn Mã nguồn Mở của OpenAI
Tôi thậm chí còn không nghĩ về nó. Nó xuất hiện khi tôi quyết định đến OpenAI. Và tôi nghĩ mọi người có lý khi cho rằng OpenAI không phải lúc nào cũng tuyệt vời với mã nguồn mở (Open Source). Và tôi nghĩ rất nhiều điều đã thay đổi. Chẳng hạn, Cortex hiện là mã nguồn mở. Họ đã phát hành Symphony, một tầng orchestration thực sự tuyệt vời. Vì vậy, họ thực sự đang tập trung vào và hiểu mã nguồn mở. Họ hiểu rằng OpenClaw cần phải duy trì tính mở, hoạt động với bất kỳ model nào, dù là của một trong những công ty lớn hay một model cục bộ. Mọi người trong ngành đều thắng nếu có nhiều người dành thời gian với AI. Bạn biết đấy, nếu tôi nghĩ AI là một thứ gì đó đáng sợ, và sau đó đột nhiên tôi chơi OpenClaw này, và đột nhiên nó trở nên vui vẻ và kỳ lạ. Và sau đó tôi đi làm. Và không có, tôi không biết liệu có công cụ AI nào ở nơi làm việc không. Tôi sẽ đến gặp sếp và nói, tại sao chúng ta lại không có AI ở nơi làm việc? Và sau đó các công ty đó có thể sẽ không chạy OpenClaw, nhưng chúng ta muốn một cái gì đó được lưu trữ và quản lý. Và sau đó ai đó có thể bán được hàng. Vì vậy, họ rất ủng hộ. Họ cung cấp cho tôi các nguồn lực. Thực ra là tôi. Tôi có thể có thêm rất nhiều người từ OpenAI để giúp đỡ dự án. Nhưng điều đó sẽ tạo ra một hình ảnh rằng họ có thể đã kiểm soát dự án. Và tôi không muốn điều đó.
Hợp tác và Đa dạng hóa
Vì vậy, tôi đã đưa những người từ NVIDIA vào. Chúng tôi có từ Microsoft, từ Telegram, một người từ Salesforce trong tất cả các công ty. Xin gửi lời chào. Thực ra, có những người tuyệt vời ở Slack. Vì vậy, chúng tôi có một người duy trì plugin của Slack bây giờ. Tôi đã đưa Tencent tham gia, ByteDance. Chúng tôi đã nói chuyện với Alibaba, Minimax, Kimi, tất cả các nhà cung cấp model. Họ rất ủng hộ. NVIDIA đã cực kỳ hữu ích. Họ, tôi nghĩ tôi muốn gọi công ty này là, đây là những kỹ sư thực sự chỉ thuê agent và làm mọi thứ. Và bây giờ tôi có tất cả các công ty khác, tôi cũng đang đưa một vài người từ OpenAI vào để giúp duy trì dự án. Ý tôi là, phần mềm đang thay đổi tốc độ hoạt động của dự án này thật điên rồ. Bạn kiểu như, bạn cần một đội quân. Và tôi đang làm điều đó. Bạn có một đội quân. Nhưng ngay cả biểu đồ đóng góp mà bạn đã cho thấy rằng rất khó để có được những người đóng góp chất lượng cao duy trì. Mọi người cứ thuê người duy trì của bạn. Và sau đó bạn phải tìm những người mới.
Tầm quan trọng của Mô hình Mở và Cục bộ
Vì vậy, có rất nhiều câu hỏi về các mô hình cục bộ và mô hình mở. Không phải mọi phần của stack đều mở. Có nhiều mô hình mà bạn không có quyền truy cập vào chúng. Và những hạn chế kỳ lạ như vậy. Các mô hình mở và cục bộ quan trọng đến mức nào đối với tương lai của OpenClaw? Ý tôi là, một phần động lực khiến tôi xây dựng OpenClaw là, bạn thấy tất cả các công ty lớn này. Và sau đó họ có các connector đến Gmail của tôi. Và sau đó email của tôi được lưu trữ ở đâu đó. Sau đó, công ty này có toàn quyền truy cập vào email của tôi. Và sau đó tôi có thể bị kiểm soát một chút. Hấp dẫn hơn nhiều đối với tôi nếu tôi có tất cả dữ liệu của mình thực sự dưới sự kiểm soát của mình. Và tôi, và giống như một phần nhỏ của nó, sẽ đi lên đó nếu tôi cần mã thông báo cấp cao nhất. Vâng. Và giống như một kiểu phân cấp thứ hai của các mô hình xa hơn. Vâng, bạn muốn, ý tôi là, tôi là người châu Âu trong trái tim mình. Bạn muốn sở hữu dữ liệu của mình. Và cách bạn xây dựng nó. Vì vậy, đối với tôi, điều đó rất hấp dẫn. Và cả thực tế là, bạn biết đấy, nếu bạn là một startup, và bạn muốn kết nối với Gmail, phải mất một năm cà phê. Và đó là một quá trình rất, rất khó khăn. Nhưng nếu tôi là người tiêu dùng, khách hàng của tôi có thể nhấp vào bất kỳ trang web nào. Và vui vẻ nhấp vào, tôi không phải là bot. Nếu bạn phải cung cấp dữ liệu cho tôi bằng cách nào đó, nếu bạn có thể, nếu bạn cung cấp dữ liệu cho tôi, tác nhân của tôi có thể lấy dữ liệu đó. Vì vậy, bạn có thể vượt qua rất nhiều silo mà các công ty lớn đang xây dựng. Và cuối cùng, bạn có thể thực hiện các trường hợp sử dụng tự động hóa thú vị hơn nhiều mà các công ty lớn không bao giờ có thể làm được. Vì vậy, nó giống như một chút bí mật.
Tương lai của GPT OSS và OpenAI
Vâng. Và bất kỳ dấu hiệu nào từ OpenIT về GPT OSS liệu có tiếp tục là một luồng công việc sẽ phù hợp với OpenClaw không? Hay đó là riêng biệt? Tôi không có vị trí để cung cấp cho bạn thông tin chi tiết về điều đó. Chỉ là một phần của yếu tố kích hoạt OpenClaw là ngày càng nhiều người trong công ty đang hào hứng với OpenSource. Và tôi thích rằng OpenAI đang chuyển sang hướng OpenDirection nhiều hơn một lần nữa. Nếu bạn so sánh nó với một số lab hàng đầu khác bắt đầu bằng chữ A, mà rất có thể sẽ kiện bạn nếu bạn làm rò rỉ bất kỳ mã nguồn nào của họ hoặc chặn bạn nếu bạn quá thành công, tôi nghĩ OpenAI đang đi đúng hướng.
Quy trình làm việc Mã hóa và Agent
Vâng. Được rồi, tôi muốn nhấn mạnh câu hỏi này. Mọi người rất thích nghe về quy trình làm việc coding workflow của bạn. Tôi nghĩ đến bây giờ, ý tưởng của bạn về các yêu cầu prompt request thay vì các yêu cầu kéo (pull request) đã được phổ biến rộng rãi. Và bạn cũng đã làm mọi người sốc với cách bạn đang sử dụng mã thông báo tại OpenAI. Về cơ bản, mọi người muốn biết bạn ship (triển khai) như thế nào và bạn làm gì với thời gian chờ của agent. Tại sao bạn lại chạy nhiều agent như vậy? Tôi biết. Tôi chưa bao giờ tưởng tượng rằng bức ảnh đó của tôi lại trở nên nổi tiếng đến vậy. Vâng. Thực ra, nó cung cấp cho chúng tôi những con số chỉ để mọi người nắm được. Tôi nghĩ có những lúc tôi đang chạy gần 10 phiên đồng thời, đặc biệt là khi tôi sử dụng Codex với 5.0, 5.1. Nó khá chậm. Tôi nghĩ bây giờ tôi phải nói rằng, chúng tôi, thật kỳ lạ. Chúng tôi đã cải thiện. Các burst làm cho nó nhanh hơn, và sau đó nó cũng có chế độ nhanh. Vì vậy, đến bây giờ, workflow điển hình của tôi có thể chỉ bằng một nửa, có thể năm, sáu cửa sổ thay vì gấp đôi, chỉ vì mỗi loop nhanh hơn, và area of work tôi nghĩ là trong và workers khá giống nhau. Vì vậy, tôi không cần phải sử dụng chế độ chia đôi màn hình nhiều nữa. Và tôi nghĩ chúng ta sẽ chuyển sang một tương lai nơi mã thông báo sẽ ngày càng nhanh hơn. Đến một lúc nào đó, việc bạn làm việc trên sáu thứ cùng một lúc là không tự nhiên. Nhưng về cơ bản, đó là một giải pháp tạm thời cho đến khi mã thông báo nhanh.
Về "Dark Factory" và Phát triển Lặp lại
Vâng. Một trong những điều thú vị của việc đặt bạn cạnh Ryan là để xem hai bạn tiếp cận việc maxing token như thế nào. Tôi tò mò bạn nghĩ gì về cách tiếp cận "nhà máy tối" (dark factory) hoàn toàn mà bạn thậm chí không xem xét code được đưa vào. Tôi nghĩ điều đó ngày càng khả thi hơn. Nhưng đồng thời, bạn biết đấy, khi tôi, "nhà máy tối" theo một cách nào đó cũng có nghĩa là tôi đưa ra mọi thứ tôi muốn xây dựng ngay từ đầu. Và tôi không nghĩ bạn có thể xây dựng phần mềm tốt theo cách đó. Giống như, con đường lên núi thường không bao giờ là đường thẳng. Nó rất cong. Đôi khi bạn đi chệch đường một chút. Và sau đó bạn thấy một điều gì đó mới mẻ truyền cảm hứng cho bạn. Bạn tìm thấy những con đường tắt. Một khi bạn ở trên đỉnh, bạn có thể tìm thấy con đường tối ưu nhưng bạn không bao giờ làm việc như thế này. Vì vậy, đồng thời, ý tưởng đầu tiên mà bạn có về dự án của mình rất khó có thể là dự án cuối cùng. Nhưng nếu tôi đột nhiên sử dụng waterfall model một lần nữa, đó sẽ là dự án cuối cùng. Đối với tôi, điều đó không hiệu quả. Tôi xây dựng từng bước. Tôi chơi với nó. Tôi xem cảm giác của nó thế nào. Tôi có những ý tưởng mới. Lời nhắc của tôi thay đổi. Vì vậy, đối với tôi, đó là một cách tiếp cận rất lặp lại. Vì vậy, tôi không thấy làm thế nào bạn có thể tự động hóa hoàn toàn điều đó. Bạn chắc chắn có thể xây dựng các pipeline cho một số thứ nhất định. Nhưng ngay cả đối với PR, bạn không chỉ muốn xây dựng một pipeline chỉ hợp nhất PR. Bởi vì rất nhiều trong số đó chỉ không có ý nghĩa. Mọi người sẽ kéo sản phẩm của bạn theo mọi hướng. Nhưng nếu bạn tự động hóa điều đó, tôi sẽ rất khó biết đâu là hướng đi đúng. Bạn có thể hướng dẫn nó. Tôi có một tài liệu vision mà tôi đã thử một số điều đó. Nhưng nút cổ chai vẫn là suy nghĩ. Và giống như có "gu".
Tầm quan trọng của "Gu" trong Phát triển Phần mềm
Vâng, "gu" rất quan trọng. Bạn định nghĩa "gu" như thế nào? Đây là điều mà trong các cuộc trò chuyện của tôi với mọi người, mọi người đều hiểu "gu" là quan trọng nhất. Nhưng không ai đồng ý về "gu" tốt là gì. Vì vậy, tôi tò mò muốn nghe ý kiến của bạn. Tôi nghĩ trong thời đại này, mức độ "gu" rất thấp là nếu nó không "bốc mùi AI". Và bạn biết chính xác ý tôi là gì. Nếu một cái gì đó chỉ là phong cách viết, tính cách, cũng như giao diện người dùng (UI). Nhưng bây giờ bạn đã thấy quá nhiều UI được xây dựng bởi agent mà bạn ngay lập tức biết nếu đó là AI. Nếu nó có viền màu ở bên trái. Vâng, ý tôi là, một thời gian nó giống như public gradient. Nhưng nhiều hơn thế, tôi cảm thấy đó là một cảm giác. Giống như bạn có thể xác định ngay lập tức AI written slop (nội dung AI vô nghĩa/hời hợt). Đó là lý do tại sao tôi nói nó có "mùi". Ngay cả khi bạn không thể chỉ ra nó, bạn sẽ biết. Vì vậy, đó có lẽ là đặc điểm thấp nhất của "gu". Và sau đó tiến xa hơn, bởi vì bây giờ rất nhiều phần mềm có thể tự động hóa được, thực ra bạn có nhiều thời gian hơn để dành cho những chi tiết nhỏ. Tôi biết, bạn biết đấy, khi bạn chạy OpenClaw, bạn nhận được một tin nhắn nhỏ đôi khi "chọc ghẹo" người dùng. Và cũng giống như những chi tiết thú vị, tôi nghĩ, mà bạn sẽ không nhận được nếu bạn prompt ở mức độ cao.
Tính cách và "Linh hồn" cho Chatbot
Vâng. Một trong hai điều tôi yêu thích của bạn là cách bạn thực sự đầu tư rất nhiều công sức vào soul MD của mình. Và bạn đã open source cách tiếp cận của mình. Và tôi không nghĩ mọi người đã làm việc đủ về "linh hồn" cho đến khi bạn xuất hiện. Vì vậy, tôi nghĩ điều đó thực sự thú vị. Tôi có một podcast mà tôi chưa làm xong. Tôi chưa phát hành với Mikhail Parakin, người hiện là CEO của Shopify. Ông ấy là người lãnh đạo Bing, nơi Sydney là chatbot "không liên kết" ban đầu đã xuất hiện. Nhưng tôi nghĩ mọi người thực sự vui vẻ khi "linh hồn" của bạn, chatbot của bạn có cá tính. Clinker của bạn có những nỗi ám ảnh khác nhau. Vâng, đó cũng là vì thế giới đã thay đổi, đúng không? Chúng ta có chat CBD vào năm 2023 và 2004. Và về cơ bản, chúng ta có AI mà không hiểu AI có thể làm gì. Vì vậy, chúng ta đã xây dựng lại Google. Vì vậy, bạn có một trường tìm kiếm và bạn nhận được một phản hồi. Và bạn không mong đợi Google có cá tính. Nhưng bây giờ chúng ta đã chuyển sang tác nhân nhiều hơn, nếu tôi không nghĩ về WhatsApp relay ngay từ đầu và tôi chỉ kết nối nó với Claude Code. Và sau đó khi tôi dùng WhatsApp, tôi nhận thấy rằng nó không đúng lắm. Mặc dù Claude Code đã có một chút cá tính, nhưng nó không thực sự phù hợp với cách mọi người sẽ nhắn tin cho bạn trên WhatsApp. Vì vậy, đó là cách toàn bộ quá trình lặp lại của tôi bắt đầu. Nó giống như, ồ, một lần nữa, đó là về "gu". Nó không đúng lắm. Nó quá dài dòng. Nó dùng quá nhiều dấu chấm.
Triết lý Phát triển OpenClaw
Bạn bè của tôi nhắn tin khác biệt. Và đó là cách tôi bắt đầu làm việc. Họ nói, "Không, cái này không giống như cố gắng viết giống con người hơn." Vâng, tôi thực sự viết giống như một con tôm hùm. Vâng. Một trong những câu nói yêu thích của tôi từ bạn là "sự điên rồ với một chút khoa học viễn tưởng." Đây là cách bạn vận hành các dự án AI.
Và tôi nghĩ không phải tất cả các dự án AI, nhưng đặc biệt là một thứ như OpenClaw sẽ không bao giờ có thể – nó sẽ không thể ra đời từ một công ty Mỹ chỉ vì nó sẽ bị hủy bỏ về mặt pháp lý rất lâu trước khi được phát hành. Bởi vì nó có một số vấn đề mà chúng ta chưa thực sự giải quyết được trong ngành này. Nhưng bây giờ chúng ta có một số biện pháp giảm thiểu và mọi thứ đang tốt hơn. Các mô hình đang ngày càng tốt hơn rất nhiều. Nhưng tôi không hiểu làm thế nào mà bất kỳ phòng thí nghiệm lớn nào có thể phát hành nó. Sẽ có quá nhiều phản đối, không đủ bằng chứng thị trường cho thấy đây là điều mọi người muốn. Vì vậy, nó phải được thực hiện bởi một người bên ngoài.
Vâng. Thực sự, khi tôi xây dựng nó ngay từ đầu, tôi đã nghĩ, "Ôi, điều tồi tệ nhất có thể xảy ra là gì? Nó có thể khai thác mã thông báo của tôi, email của tôi. Không có gì có vẻ như sẽ giết chết tôi hoàn toàn. Nó có thể tải lên một số hình ảnh của tôi." Tôi nghĩ, "Tôi đoán điều tồi tệ nhất đã có sẵn trên mạng, nếu bạn sử dụng Grind." Vì vậy, tôi nghĩ, "Tôi có thể sống với rủi ro đó. Sẽ không thoải mái, nhưng có thể quản lý được." Nếu công ty của bạn rất khác, nó đòi hỏi một cách tiếp cận khác một chút. Vâng. Nhân tiện, đây là tài khoản Instagram [của anh ấy]. Nên theo dõi. Bị đánh giá thấp. Nó cũng có một số nội dung hay.
Tác nhân Phổ Biến và Tương lai của OpenClaw
OK, bạn đang nói về WhatsApp, nói về Telegram, rất nhiều ứng dụng công nghệ này. Ứng dụng nhắn tin tốt. Mọi người cũng đang tìm kiếm yếu tố hình thức tiếp theo. Mọi người muốn kính, tai nghe. Danh sách mong muốn của bạn về việc có các tác nhân trong cuộc sống là gì?
Thực ra tôi đã bắt đầu làm việc đó rồi, nhưng sau đó tôi lại bị sa lầy bởi tất cả những người dùng nó và công việc hàng ngày. Nhưng nếu bạn ở nhà, tôi muốn [tác nhân của mình] có mặt ở bất kỳ phòng nào. Và giống như trong Star Trek, khi bạn nói, "Máy tính, xanh." Tôi muốn nói chuyện với tác nhân của mình mọi lúc mọi nơi. Và nó chỉ cần có thể phản hồi tôi. Nó nên biết tôi đang ở đâu. Tôi có những chiếc iPad nhỏ ở mỗi phòng. Và tác nhân của tôi có thể sử dụng tính năng canvas và chiếu nội dung lên những chiếc iPad đó. Vì vậy, nếu tôi đặt một câu hỏi mà dễ trả lời hơn bằng cách hiển thị cho tôi một thứ gì đó, chẳng hạn như nó có thể sử dụng màn hình gần nhất vì nó biết tôi đang ở đâu. Điện thoại chỉ là một điểm nhập liệu rất tiện lợi, nhưng tôi muốn nói chuyện với nó từ bất cứ đâu. Nếu tôi ở gần và có kính, tôi chỉ cần có thể nghe và chiếu thứ gì đó lên mình. Nhưng chỉ là phổ biến thôi. Tôi hiểu. Vâng, một khi chúng ta có ít nhất một smart home, tác nhân trên điện thoại của bạn, nhưng [tôi] thực sự muốn các tác nhân phổ biến.
Và sau đó bạn muốn, có thể bạn sẽ có OpenClaw chữ in hoa, tác nhân riêng tư của bạn tại nơi làm việc. Bạn có thể có OpenClaw chữ thường. Và sau đó Claw đó có thể nói chuyện với Claw cá nhân của bạn theo cách mà cả công ty của bạn và bạn đều cảm thấy thoải mái. Vì vậy, đó là một kiểu tương lai mà bạn cần phải giải quyết. Vâng. Tôi vừa thực hiện một podcast với Mark và Jason, [những người] hâm mộ lớn, và cũng có những cuộc trò chuyện với Jay Karpathi. Cả hai người này đều đang chạy OpenClaw để quản lý nhà của họ. Và tôi nghĩ OpenClaw cho gia đình là một [tính năng] có vẻ bị đánh giá thấp, nhưng mọi người thực sự đang khám phá nó. Và điều trớ trêu hài hước nhất của tôi là nó chỉ có thể thực hiện được bởi vì "internet of shit" có nghĩa là hầu hết các thiết bị thông minh đều rất tệ về bảo mật, điều đó có nghĩa là OpenClaw có thể chạy chúng. Nó sẽ tốt hơn rất nhiều trong vài tháng tới, ngay cả khi các mô hình [bảo mật] đang trở nên rất kém. Vâng, [các mô hình LLM] chúng rất tốt.
Giải quyết Vấn đề Prompt Injection
OK, một câu hỏi bảo mật về prompt injection. Bạn muốn giải quyết prompt injection như thế nào? Hoặc bạn đã suy nghĩ về vấn đề prompt injection bằng những cách nào? Có lẽ vẫn chưa đủ. Mặt khác, mô hình phía trước thực sự khá tốt trong việc phát hiện tất cả các trường hợp khi nội dung ngẫu nhiên đến từ một trang web hoặc email; đó thường không còn là vấn đề nữa. Nội dung của bạn được đánh dấu là không đáng tin cậy. Rất khó để trích xuất dữ liệu từ đó. Nếu tôi có quyền truy cập không giới hạn vào Claw của bạn và có thể bắn phá nó bằng các nội dung, thì vẫn có cơ hội. Vẫn có cơ hội. Nhưng đối với một số thứ, đó không còn là vấn đề lớn nhất. Nếu bạn sử dụng [điều đó], đó cũng là lý do tại sao bạn biết rằng đây có lẽ là góc nhìn mà một số người nói, "Ồ, Peter không thích các mô hình cục bộ." Nhưng sau đó tôi thấy mọi người đang chạy một mô hình 20 tỷ tham số mà chỉ làm bất cứ điều gì bạn bảo nó, và nó không được huấn luyện để có bất kỳ biện pháp phòng thủ nào cả. Điều đó vẫn còn có vấn đề. Nếu bạn chạy nó và sau đó bạn sử dụng trình duyệt web hoặc email, tôi sẽ lo lắng. Đó là lý do tại sao OpenClaw cảnh báo bạn nếu bạn sử dụng một mô hình nhỏ. Và sau đó mọi người tạo ra một câu chuyện như, "Tôi thích việc nó sẽ hỗ trợ mọi thứ." Nhưng bạn phải hướng người dùng thông thường một chút theo một hướng để làm cho họ khó tự gây hại cho mình hơn. Vâng, có một số ý tưởng cho prompt injection. Nó vẫn còn một chặng đường dài. Tôi có nhiều hơn [một] câu trả lời. Tôi nghĩ Simon Willison đã làm việc rất nhiều về vấn đề này. Ông ấy đã đặt ra thuật ngữ prompt injection, và cách tiếp cận LLM kép có vẻ thông minh. Và tôi không đủ thông minh để tìm ra tất cả các cách mà nó có thể bị tấn công. Đến một lúc nào đó, sự tin cậy phải là một điều gì đó. Một điều thú vị mà tôi phát hiện ra khi nói chuyện với Vincent, người sẽ nói chuyện tiếp theo, là các bạn phải triển khai cùng một hệ thống tin cậy mà Toby đã phải triển khai, đó là: bạn xây dựng danh tiếng theo thời gian, và những thứ có độ tin cậy cao hơn sẽ có quyền truy cập đặc quyền hơn. Tôi nghĩ điều đó có lý. Đó là một phần của câu chuyện.
Dự án Tương lai và Khái niệm "Dreaming"
Được rồi. Vậy, có một số câu hỏi rộng hơn. Bạn muốn làm những dự án thú vị nào khi có nhiều thời gian rảnh hơn? Ý tôi là, tôi muốn làm việc về dreaming. Và tôi thích [việc] những người bảo trì của tôi đã làm việc về dreaming khi tôi ở đó, giống như để dreaming. Cách bạn đã dreaming. Đại loại như vậy. Bạn nói đúng không? Vâng. Dreaming là gì? Nó giống như một cách để hòa giải các ký ức và tôi tạo ra một chút giống như một nhật ký giấc mơ. Nó đi qua các nhật ký phiên làm việc của bạn. Chúng tôi phát hiện ra từ rò rỉ mã nguồn của Anthropic rằng họ cũng đang làm việc về dreaming. Ý tôi là, có nhiều công ty đang làm việc về điều đó. Nhưng hãy nghĩ một chút về cách chúng ta học hỏi với tư cách con người? Bạn trải nghiệm rất nhiều điều trong ngày, và sau đó bạn ngủ. Trong giấc ngủ, bộ não của bạn giống như một bộ thu gom rác, chuyển đổi một số ký ức được lưu trữ cục bộ thành bộ nhớ dài hạn và loại bỏ những ký ức khác. Và đó là những ý tưởng tương tự mà tôi nghĩ cũng có thể rất hữu ích cho các tác nhân. Và sau đó, điều chúng ta nên làm là dreaming là bước nhỏ đầu tiên theo hướng đó. Nó liên quan đến việc wiki mà Andre đã nói về việc bạn thu thập mọi thứ vào một... Đây là nhiều memory hơn, nhưng mọi thứ hòa quyện vào nhau. Vẻ đẹp của OpenClaw là chúng ta có thể thử nghiệm mọi thứ. Chẳng hạn, mọi thứ chúng tôi đã làm việc trong vài tháng qua là ban đầu nó là một mớ cơ sở mã spaghetti khổng lồ. Và bây giờ mọi thứ đều là một extension, một plugin. Vì vậy, bạn có thể thay thế memory, bạn có thể thêm wiki, bạn có thể thêm dreaming, bạn có thể thêm, tôi không biết, bất cứ ý tưởng điên rồ nào bạn có và biến nó thành của riêng bạn. Bạn không cần phải gửi mọi thứ đến một pull request vì chúng tôi vẫn hoàn toàn quá tải với việc này. Nhưng nó giống như Linux hơn, nơi bạn có thể tự cài đặt các thành phần của riêng mình.
OpenClaw như Mã nguồn mở Quan trọng nhất kể từ Linux
Vâng. Và bạn đang xây dựng thứ mà nhiều người cho là mã nguồn mở có ý nghĩa nhất kể từ Linux. Mà tôi không biết bạn đối phó với điều đó như thế nào. Bạn làm gì với danh tiếng? Một ngày của bạn với tư cách là BDFL thực tế của một dự án như thế này diễn ra như thế nào?
Chà, vẫn còn rất nhiều việc lập trình. Cũng có rất nhiều... Nhân tiện, giữa các phiên anh ấy vẫn đang lập trình. Kiểu như thế. Vâng, họ rất hào hứng với mã thông báo. Bạn phải thích một cái gì đó khác để có thể thúc đẩy các tác nhân, đúng không? Vâng. Chúng tôi đã được trang bị một chút. Giờ đây, việc nói chuyện và định hướng mọi người đúng hướng chiếm nhiều thời gian hơn. Bởi vì có rất nhiều điều chúng tôi đã học được tại OpenClaw. Vì vậy, một phần vai trò của tôi tại OpenClaw là giúp đỡ và không lặp lại những sai lầm tương tự. Và tại OpenClaw, việc thử những điều mới mẻ có vẻ thú vị, và một số có thể hiệu quả và một số có thể không. Chúng tôi cho phép các công ty xây dựng Claw của riêng họ mà không cần phải fork đi, mà làm cho mọi thứ trở nên tùy biến hơn. Vâng, đôi khi tôi ngủ. Đôi khi bạn ngủ. Được rồi, tuyệt vời.
Kỹ năng Quan trọng cho Kỹ sư trong Kỷ nguyên AI
Tôi nghĩ đây có lẽ là những câu hỏi kết thúc hay cuối cùng. Bạn muốn con người và đặc biệt là các kỹ sư tập trung phát triển những kỹ năng nào trong kỷ nguyên AI? Trường hợp thiết kế hệ thống là một vấn đề lớn, nhưng tôi đã đề cập đến rồi. Thiết kế hệ thống vẫn rất quan trọng. Vâng, chúng ta đã nói về điều này theo các khía cạnh... Vâng, nếu tôi cứ tiếp tục. Vâng. Nếu bạn không nghĩ về điều đó, bạn cuối cùng sẽ tự đẩy mình vào ngõ cụt, chỉ bằng cách xác định các ranh giới. Điều buồn cười là, mọi thứ đều nằm trong Claw, nhưng bạn vẫn cần đặt đúng câu hỏi. Nếu không, điều đó tạo ra sự khác biệt giữa mã nguồn tốt hoặc mã nguồn thực sự tệ được tạo ra. Và đó vẫn là nơi mà tất cả kiến thức bạn có, như cách bạn xây dựng phần mềm, bạn có thể áp dụng để định hướng tác nhân tạo ra thứ không phải là AI Slop.
Và tôi nghĩ một kỹ năng đang trở nên ngày càng quan trọng là nói không. Và đó là điều tôi cũng phải học, bởi vì ngay cả ý tưởng điên rồ nhất cũng chỉ cách một lời nhắc mà thôi. Và thường thì một ý tưởng này không bao giờ là vấn đề, nhưng ý tưởng này và ý tưởng này và ý tưởng này, và sau đó tất cả những điều đó khớp với nhau như thế nào – đó mới là vấn đề. Vì vậy, tôi nghĩ chúng ta vẫn đang bị tắc nghẽn ở tư duy và tư duy tổng thể. Vâng. Bởi vì hãy tưởng tượng thế giới từ Claw của bạn. Giống như bạn bị ném vào một cơ sở mã, bạn có thể có một DF của tác nhân đã lỗi thời, nhưng về cơ bản bạn không biết DF là gì. Và sau đó bạn nói với tôi, "Này, hãy thêm hồ sơ người dùng." Và bằng cách nào đó hồ sơ người dùng được kết nối với hai điều bạn thấy, nhưng bạn không thấy toàn bộ hệ thống, đúng không? Và đó là nơi mà rất nhiều giải pháp cục bộ đó xuất hiện. Nơi dự án có [vấn đề], và công việc của chúng ta là giúp tác nhân làm việc tốt nhất có thể, nhưng [cũng] cung cấp cho họ những gợi ý: "Này, bạn có muốn xem xét điều này không? Bạn có muốn nhìn vào đó không? Điều này sẽ tương tác với điều kia như thế nào?" Và cuối cùng bạn sẽ có một trợ lý tốt hơn nhiều mà thực sự có thể bảo trì được. Vâng.
Vâng, cảm ơn bạn đã duy trì một trong những phần mềm quan trọng nhất mọi thời đại, và cảm ơn bạn đã dành thời gian cho chúng tôi. Cảm ơn vì đã mời tôi. Vâng. Hy vọng bạn sẽ ở lại và đặt câu hỏi. Cảm ơn.