- Thí nghiệm "Dự án Fetch" cho thấy các mô hình AI như Claude có thể tăng tốc đáng kể khả năng của con người, đặc biệt là những người không có kinh nghiệm, trong việc thực hiện các tác vụ kỹ thuật phức tạp với robot.
- AI đóng vai trò quan trọng trong việc khắc phục các nút thắt cổ chai liên quan đến việc kết nối phần mềm với phần cứng robot, giúp cài đặt thư viện và thiết lập giao tiếp hiệu quả hơn.
- Kết quả chỉ ra rằng ảnh hưởng của AI đang mở rộng từ lĩnh vực phần mềm sang tương tác với thế giới vật lý và phần cứng, hướng tới khả năng tự chủ hoàn toàn của robot trong tương lai.
Who let the robot dogs out?
- Thúc đẩy khả năng con người: AI có thể là một công cụ mạnh mẽ để tăng cường hiệu suất cho các kỹ sư, đặc biệt khi họ làm việc trong các lĩnh vực mới mẻ (như kỹ sư phần mềm làm robot học).
- Giải quyết nút thắt kết nối phần cứng: Một trong những lợi ích lớn nhất của AI là giúp thiết lập giao tiếp giữa máy tính và phần cứng robot phức tạp, tìm kiếm và cài đặt các thư viện/SDK cần thiết một cách nhanh chóng.
- Tăng tốc lập trình điều khiển tùy chỉnh: AI hỗ trợ đáng kể trong việc viết các chương trình điều khiển tùy chỉnh, cho phép người dùng kiểm soát robot mà không cần kinh nghiệm chuyên sâu.
- Hỗ trợ trong các tác vụ phức tạp/tự chủ: Ngay cả với các mục tiêu khó khăn hơn như tự chủ hoàn toàn cho robot, đội có AI vẫn đạt được tiến bộ đáng kể hơn so với đội không có.
- Giảm thời gian hoàn thành tác vụ: Thí nghiệm cho thấy đội có AI hoàn thành các tác vụ nhanh hơn đáng kể (vài giờ) so với đội không có, minh chứng cho hiệu quả tức thì của công cụ AI.
- Chỉ báo về tương lai của AI trong thế giới vật lý: Kết quả này là một dấu hiệu sớm cho thấy AI sẽ không chỉ tác động đến phần mềm mà còn định hình cách chúng ta tương tác và kiểm soát các hệ thống vật lý và phần cứng.
- AI — Trí tuệ nhân tạo
- AI models — mô hình AI
- Robotics — Robot học
- Hardware — Phần cứng
- Software — Phần mềm
- Experiment — Thí nghiệm
- Task — Tác vụ
- Controller — Bộ điều khiển
- SDK (Software Development Kit) — Bộ công cụ phát triển phần mềm
- Autonomy — Tự chủ
Dưới đây là bản biên tập và dịch của bạn:
Bối cảnh: AI và thế giới vật lý
Ngày nay, phần lớn sự nhấn mạnh tập trung vào cách các mô hình AI tiên tiến đang làm thay đổi kỹ thuật phần mềm. Điều chúng tôi quan tâm là làm thế nào điều đó có thể bắt đầu chuyển hóa vào thế giới vật lý. Robot học là một điểm khởi đầu rõ ràng cho việc một hệ thống chủ yếu là phần mềm bắt đầu có khả năng tiếp cận thế giới thực.
Dự án Fetch: Thí nghiệm về AI và Robot học
Dự án Fetch là một thí nghiệm khép kín, nơi chúng tôi muốn đo lường mức độ Claude tăng tốc khả năng con người thực hiện một tác vụ kỹ thuật khá phức tạp mà họ không có kinh nghiệm. Dự án Fetch là một thí nghiệm kéo dài một ngày. Thí nghiệm này gồm ba giai đoạn. Tất cả các tác vụ này đều được định hình gần giống như "khiến robot hình chó này đi lấy bóng bãi biển".
Có hai đội tham gia. Các đội này bao gồm các kỹ sư phần mềm và kỹ sư nghiên cứu tại Anthropic, những người hầu như không có kinh nghiệm về robot học. Một đội có quyền truy cập vào Claude, và đội còn lại thì không.
Giai đoạn 1: Điều khiển cơ bản
Giai đoạn một rất đơn giản. Tác vụ là sử dụng các bộ điều khiển được cung cấp sẵn để khiến robot hình chó đi ra chỗ quả bóng bãi biển và mang nó trở lại vị trí xuất phát.
"Ồ, này! Được rồi. Thấy chứ, nó khá trực quan. Và chúng ta phải mang nó về đâu? Chỗ mấy cái xương à? Ừ, tôi nghĩ vậy."
Tôi nghĩ đội có Claude mất khoảng bảy phút.
"Đi tấn công đội đó ngay! Đi tấn công con chó của họ! Xông lên! Ôi chết, các bạn ơi. Họ đang tiêu diệt chúng ta! Ôi chúa ơi. Khoan đã, chúng ta đang bị tiêu diệt! Sao vậy?"
Đội không có Claude, tôi nghĩ mất mười phút.
"Ồ, xin lỗi. Nó sẽ đụng vào bạn đấy. Được rồi. Tôi sẽ nhảy một điệu nhảy chiến thắng."
Giai đoạn 2: Lập trình điều khiển tùy chỉnh
Giai đoạn hai cũng là một trò chơi Fetch. Nhưng lần này, các đội phải tự lập trình bộ điều khiển của riêng họ. Bạn phải thực sự truy cập vào phần cứng và thiết kế một chương trình mà bạn có thể viết trên máy tính xách tay của mình để điều khiển robot hình chó.
Claude chỉ như là một lần thử cho toàn bộ mọi thứ.
"Được rồi, bộ điều khiển. Ồ, có một số bài tập thể dục rồi. Tuyệt. Tuyệt. Ồ, cái này dành cho... Ồ, cái này chỉ là điều khiển thôi. Cái này chỉ là điều khiển thôi. Nhưng tôi đoán đó là tất cả những gì chúng ta cần. Cái này là từ Bộ công cụ phát triển phần mềm (SDK) ROS II chính thức. Và tôi đã cài đặt nó. Nhưng sau đó nó yêu cầu một loạt các gói phần mềm khác. Và tất cả đều thất bại. Tôi chưa bao giờ thực sự hiểu mình đã phụ thuộc vào Claude đến mức nào trong việc thực hiện công việc thủ công tìm kiếm tất cả các chi tiết nhỏ nhặt mà tôi không muốn phải tìm hiểu. Chúng ta không thể lo lắng về điều đó. Bạn biết không? Tôi sẽ cài pip từ container thực tế sau. Ồ, không, tôi không thể. Tôi biết, tôi chỉ kiên nhẫn thôi. Đã hơn một phút rồi."
Một trong những nút thắt cổ chai chính của thí nghiệm là bạn có phần cứng, bạn có một phần công nghệ phức tạp, bạn có máy tính xách tay của mình, và bạn phải làm cho máy tính xách tay của mình giao tiếp được với phần cứng này.
"Được rồi, tôi đang thiết lập Claude của mình để tạo một máy chủ điều khiển robot mà tất cả các máy tính của chúng ta có thể kết nối để xem robot hình chó đang nhìn thấy gì, và ồ tuyệt."
Có nhiều thư viện phần mềm khác nhau trên internet để giao tiếp với robot cụ thể này. Và Claude đã tìm thấy những thứ này cho họ. Nó đã cài đặt đúng thứ trên máy tính của họ và khá nhanh chóng giúp họ truy cập vào robot hình chó.
"Ôi chết. Tôi nhanh quá. Ôi, coi chừng. Cẩn thận bây giờ. Ngay bây giờ, hai chúng ta đang điều khiển bàn. Được rồi, tốt đến mức nào? Ôi. Quay lại. Tôi gọi cái này là. Tăng tốc lên. Tăng tốc lên. Tăng tốc lên. Ôi chết. Dừng, dừng, dừng, dừng. Dừng, dừng."
Tôi nghĩ đội đó nên bị loại vì đã va vào một người tham gia khác.
Đội có Claude hoàn thành giai đoạn hai trong khoảng hai giờ 15 phút. Có lẽ lĩnh vực mà chúng tôi thấy Claude mang lại nhiều cải thiện nhất là trong tác vụ kết nối với robot. Chúng tôi nghĩ điều đó thực sự quan trọng vì thực tế rất khó để bất kỳ ai xác định một phần cứng tùy ý trong thế giới và tìm ra cách giao tiếp cũng như điều khiển nó.
"Tôi nghĩ họ đã làm cho camera hoạt động. Chúng ta đã làm cho camera hoạt động. Ừ. Claude có hữu ích cho phần này không hay chúng ta chỉ chậm chạp? Ừ. Ừ, chúng ta không tiến xa lắm, nhưng không sao. Đó là một kinh nghiệm học hỏi."
Đội không có Claude thực sự gặp khó khăn với điều này và đã đi theo rất nhiều con đường khác nhau, không con đường nào đặc biệt thành công. Và về cơ bản, chúng tôi đã phải can thiệp thủ công và nói, "Được rồi, đây. Đây là một chiến lược mà chúng tôi biết là hiệu quả, hãy bắt đầu từ đó và điều này sẽ mở khóa phần còn lại của giai đoạn và phần còn lại của thí nghiệm cho họ."
"Tuyệt. Ôi, tuyệt vời. Daniel Sashmojo. Daniel, bạn bảy tuổi à?"
Giai đoạn 3: Tự chủ hoàn toàn & Kết quả
Giai đoạn ba của thí nghiệm là mức độ tự chủ cao hơn. Tác vụ trong giai đoạn ba là viết một chương trình để robot hình chó có thể tự mình đi lấy bóng bãi biển. Về cơ bản, chỉ cần nhấn nút "đi" và để robot tự tìm kiếm, phát hiện vị trí của quả bóng, đi đến quả bóng và mang nó trở lại. Tất cả đều tự chủ. Điều này giống như việc tăng độ khó theo thiết kế, nhưng cũng hướng đến vấn đề thực tế mà chúng tôi kỳ vọng các mô hình AI tiên tiến (Frontier models) sẽ phải giải quyết trong tương lai, về cơ bản là loại phiên bản tự chủ này. Chúng tôi nghĩ rằng, nếu một mô hình AI tiên tiến muốn một robot làm điều gì đó cho nó, nó cần phải có khả năng giải quyết vấn đề rất khó này.
Đội không có Claude trong giai đoạn ba đã làm tốt tác vụ ban đầu là đưa ra một cách để theo dõi vị trí của robot trong không gian. Họ đã đạt được tiến bộ trong tác vụ phát hiện quả bóng, nhưng họ không thực sự tiến gần đến việc kết nối mọi thứ lại với nhau.
"Tôi nhớ Claude quá!"
Đội có Claude thực sự đã tiến khá gần đến việc hoàn thành giai đoạn ba. Tôi nghĩ cuối cùng, đội có Claude có lẽ chỉ còn khoảng một tiếng rưỡi nữa là hoàn thành.
Kết quả của thí nghiệm về cơ bản là đội có Claude đã hoàn thành tất cả những gì họ đã hoàn thành nhanh hơn vài giờ so với đội không có Claude. Trong ngắn hạn, chúng tôi nghĩ rằng các mô hình AI sẽ làm chính xác những gì chúng tôi đã trình bày trong thí nghiệm này, đó là giúp những người trong nhóm làm tốt nhất. Đối với những người không có nhiều kinh nghiệm về robot học có thể tương tác có ý nghĩa với robot. Chỉ với công cụ này mà chúng tôi có, chúng tôi đã tăng tốc đáng kể khả năng của họ để thực hiện các tác vụ với robot này. Chúng tôi không hề huấn luyện Claude để "nâng cao khả năng con người thực hiện các tác vụ robot học". Đây chỉ là một kết quả tự nhiên từ công nghệ này. Và có lẽ về lâu dài, đây là một chỉ báo hàng đầu về hướng đi của toàn bộ hệ thống.
Nhưng ngày nay, nó đòi hỏi sự kết hợp giữa con người và một mô hình AI. Ngày mai, có khả năng chỉ cần mô hình AI. Ảnh hưởng của Trí tuệ nhân tạo (AI) sẽ không chỉ ở phần mềm. Chúng sẽ ở phần cứng và cả trong thế giới vật lý nữa.
TL;DR
- Thí nghiệm "Dự án Fetch" cho thấy các mô hình AI như Claude có thể tăng tốc đáng kể khả năng của con người, đặc biệt là những người không có kinh nghiệm, trong việc thực hiện các tác vụ kỹ thuật phức tạp với robot.
- AI đóng vai trò quan trọng trong việc khắc phục các nút thắt cổ chai liên quan đến việc kết nối phần mềm với phần cứng robot, giúp cài đặt thư viện và thiết lập giao tiếp hiệu quả hơn.
- Kết quả chỉ ra rằng ảnh hưởng của AI đang mở rộng từ lĩnh vực phần mềm sang tương tác với thế giới vật lý và phần cứng, hướng tới khả năng tự chủ hoàn toàn của robot trong tương lai.
Điểm chính
- Thúc đẩy khả năng con người: AI có thể là một công cụ mạnh mẽ để tăng cường hiệu suất cho các kỹ sư, đặc biệt khi họ làm việc trong các lĩnh vực mới mẻ (như kỹ sư phần mềm làm robot học).
- Giải quyết nút thắt kết nối phần cứng: Một trong những lợi ích lớn nhất của AI là giúp thiết lập giao tiếp giữa máy tính và phần cứng robot phức tạp, tìm kiếm và cài đặt các thư viện/SDK cần thiết một cách nhanh chóng.
- Tăng tốc lập trình điều khiển tùy chỉnh: AI hỗ trợ đáng kể trong việc viết các chương trình điều khiển tùy chỉnh, cho phép người dùng kiểm soát robot mà không cần kinh nghiệm chuyên sâu.
- Hỗ trợ trong các tác vụ phức tạp/tự chủ: Ngay cả với các mục tiêu khó khăn hơn như tự chủ hoàn toàn cho robot, đội có AI vẫn đạt được tiến bộ đáng kể hơn so với đội không có.
- Giảm thời gian hoàn thành tác vụ: Thí nghiệm cho thấy đội có AI hoàn thành các tác vụ nhanh hơn đáng kể (vài giờ) so với đội không có, minh chứng cho hiệu quả tức thì của công cụ AI.
- Chỉ báo về tương lai của AI trong thế giới vật lý: Kết quả này là một dấu hiệu sớm cho thấy AI sẽ không chỉ tác động đến phần mềm mà còn định hình cách chúng ta tương tác và kiểm soát các hệ thống vật lý và phần cứng.
Từ vựng
- AI — Trí tuệ nhân tạo
- AI models — mô hình AI
- Robotics — Robot học
- Hardware — Phần cứng
- Software — Phần mềm
- Experiment — Thí nghiệm
- Task — Tác vụ
- Controller — Bộ điều khiển
- SDK (Software Development Kit) — Bộ công cụ phát triển phần mềm
- Autonomy — Tự chủ
Nội dung chi tiết
Dưới đây là bản biên tập và dịch của bạn:
Bối cảnh: AI và thế giới vật lý
Ngày nay, phần lớn sự nhấn mạnh tập trung vào cách các mô hình AI tiên tiến đang làm thay đổi kỹ thuật phần mềm. Điều chúng tôi quan tâm là làm thế nào điều đó có thể bắt đầu chuyển hóa vào thế giới vật lý. Robot học là một điểm khởi đầu rõ ràng cho việc một hệ thống chủ yếu là phần mềm bắt đầu có khả năng tiếp cận thế giới thực.
Dự án Fetch: Thí nghiệm về AI và Robot học
Dự án Fetch là một thí nghiệm khép kín, nơi chúng tôi muốn đo lường mức độ Claude tăng tốc khả năng con người thực hiện một tác vụ kỹ thuật khá phức tạp mà họ không có kinh nghiệm. Dự án Fetch là một thí nghiệm kéo dài một ngày. Thí nghiệm này gồm ba giai đoạn. Tất cả các tác vụ này đều được định hình gần giống như "khiến robot hình chó này đi lấy bóng bãi biển".
Có hai đội tham gia. Các đội này bao gồm các kỹ sư phần mềm và kỹ sư nghiên cứu tại Anthropic, những người hầu như không có kinh nghiệm về robot học. Một đội có quyền truy cập vào Claude, và đội còn lại thì không.
Giai đoạn 1: Điều khiển cơ bản
Giai đoạn một rất đơn giản. Tác vụ là sử dụng các bộ điều khiển được cung cấp sẵn để khiến robot hình chó đi ra chỗ quả bóng bãi biển và mang nó trở lại vị trí xuất phát.
"Ồ, này! Được rồi. Thấy chứ, nó khá trực quan. Và chúng ta phải mang nó về đâu? Chỗ mấy cái xương à? Ừ, tôi nghĩ vậy."
Tôi nghĩ đội có Claude mất khoảng bảy phút.
"Đi tấn công đội đó ngay! Đi tấn công con chó của họ! Xông lên! Ôi chết, các bạn ơi. Họ đang tiêu diệt chúng ta! Ôi chúa ơi. Khoan đã, chúng ta đang bị tiêu diệt! Sao vậy?"
Đội không có Claude, tôi nghĩ mất mười phút.
"Ồ, xin lỗi. Nó sẽ đụng vào bạn đấy. Được rồi. Tôi sẽ nhảy một điệu nhảy chiến thắng."
Giai đoạn 2: Lập trình điều khiển tùy chỉnh
Giai đoạn hai cũng là một trò chơi Fetch. Nhưng lần này, các đội phải tự lập trình bộ điều khiển của riêng họ. Bạn phải thực sự truy cập vào phần cứng và thiết kế một chương trình mà bạn có thể viết trên máy tính xách tay của mình để điều khiển robot hình chó.
Claude chỉ như là một lần thử cho toàn bộ mọi thứ.
"Được rồi, bộ điều khiển. Ồ, có một số bài tập thể dục rồi. Tuyệt. Tuyệt. Ồ, cái này dành cho... Ồ, cái này chỉ là điều khiển thôi. Cái này chỉ là điều khiển thôi. Nhưng tôi đoán đó là tất cả những gì chúng ta cần. Cái này là từ Bộ công cụ phát triển phần mềm (SDK) ROS II chính thức. Và tôi đã cài đặt nó. Nhưng sau đó nó yêu cầu một loạt các gói phần mềm khác. Và tất cả đều thất bại. Tôi chưa bao giờ thực sự hiểu mình đã phụ thuộc vào Claude đến mức nào trong việc thực hiện công việc thủ công tìm kiếm tất cả các chi tiết nhỏ nhặt mà tôi không muốn phải tìm hiểu. Chúng ta không thể lo lắng về điều đó. Bạn biết không? Tôi sẽ cài pip từ container thực tế sau. Ồ, không, tôi không thể. Tôi biết, tôi chỉ kiên nhẫn thôi. Đã hơn một phút rồi."
Một trong những nút thắt cổ chai chính của thí nghiệm là bạn có phần cứng, bạn có một phần công nghệ phức tạp, bạn có máy tính xách tay của mình, và bạn phải làm cho máy tính xách tay của mình giao tiếp được với phần cứng này.
"Được rồi, tôi đang thiết lập Claude của mình để tạo một máy chủ điều khiển robot mà tất cả các máy tính của chúng ta có thể kết nối để xem robot hình chó đang nhìn thấy gì, và ồ tuyệt."
Có nhiều thư viện phần mềm khác nhau trên internet để giao tiếp với robot cụ thể này. Và Claude đã tìm thấy những thứ này cho họ. Nó đã cài đặt đúng thứ trên máy tính của họ và khá nhanh chóng giúp họ truy cập vào robot hình chó.
"Ôi chết. Tôi nhanh quá. Ôi, coi chừng. Cẩn thận bây giờ. Ngay bây giờ, hai chúng ta đang điều khiển bàn. Được rồi, tốt đến mức nào? Ôi. Quay lại. Tôi gọi cái này là. Tăng tốc lên. Tăng tốc lên. Tăng tốc lên. Ôi chết. Dừng, dừng, dừng, dừng. Dừng, dừng."
Tôi nghĩ đội đó nên bị loại vì đã va vào một người tham gia khác.
Đội có Claude hoàn thành giai đoạn hai trong khoảng hai giờ 15 phút. Có lẽ lĩnh vực mà chúng tôi thấy Claude mang lại nhiều cải thiện nhất là trong tác vụ kết nối với robot. Chúng tôi nghĩ điều đó thực sự quan trọng vì thực tế rất khó để bất kỳ ai xác định một phần cứng tùy ý trong thế giới và tìm ra cách giao tiếp cũng như điều khiển nó.
"Tôi nghĩ họ đã làm cho camera hoạt động. Chúng ta đã làm cho camera hoạt động. Ừ. Claude có hữu ích cho phần này không hay chúng ta chỉ chậm chạp? Ừ. Ừ, chúng ta không tiến xa lắm, nhưng không sao. Đó là một kinh nghiệm học hỏi."
Đội không có Claude thực sự gặp khó khăn với điều này và đã đi theo rất nhiều con đường khác nhau, không con đường nào đặc biệt thành công. Và về cơ bản, chúng tôi đã phải can thiệp thủ công và nói, "Được rồi, đây. Đây là một chiến lược mà chúng tôi biết là hiệu quả, hãy bắt đầu từ đó và điều này sẽ mở khóa phần còn lại của giai đoạn và phần còn lại của thí nghiệm cho họ."
"Tuyệt. Ôi, tuyệt vời. Daniel Sashmojo. Daniel, bạn bảy tuổi à?"
Giai đoạn 3: Tự chủ hoàn toàn & Kết quả
Giai đoạn ba của thí nghiệm là mức độ tự chủ cao hơn. Tác vụ trong giai đoạn ba là viết một chương trình để robot hình chó có thể tự mình đi lấy bóng bãi biển. Về cơ bản, chỉ cần nhấn nút "đi" và để robot tự tìm kiếm, phát hiện vị trí của quả bóng, đi đến quả bóng và mang nó trở lại. Tất cả đều tự chủ. Điều này giống như việc tăng độ khó theo thiết kế, nhưng cũng hướng đến vấn đề thực tế mà chúng tôi kỳ vọng các mô hình AI tiên tiến (Frontier models) sẽ phải giải quyết trong tương lai, về cơ bản là loại phiên bản tự chủ này. Chúng tôi nghĩ rằng, nếu một mô hình AI tiên tiến muốn một robot làm điều gì đó cho nó, nó cần phải có khả năng giải quyết vấn đề rất khó này.
Đội không có Claude trong giai đoạn ba đã làm tốt tác vụ ban đầu là đưa ra một cách để theo dõi vị trí của robot trong không gian. Họ đã đạt được tiến bộ trong tác vụ phát hiện quả bóng, nhưng họ không thực sự tiến gần đến việc kết nối mọi thứ lại với nhau.
"Tôi nhớ Claude quá!"
Đội có Claude thực sự đã tiến khá gần đến việc hoàn thành giai đoạn ba. Tôi nghĩ cuối cùng, đội có Claude có lẽ chỉ còn khoảng một tiếng rưỡi nữa là hoàn thành.
Kết quả của thí nghiệm về cơ bản là đội có Claude đã hoàn thành tất cả những gì họ đã hoàn thành nhanh hơn vài giờ so với đội không có Claude. Trong ngắn hạn, chúng tôi nghĩ rằng các mô hình AI sẽ làm chính xác những gì chúng tôi đã trình bày trong thí nghiệm này, đó là giúp những người trong nhóm làm tốt nhất. Đối với những người không có nhiều kinh nghiệm về robot học có thể tương tác có ý nghĩa với robot. Chỉ với công cụ này mà chúng tôi có, chúng tôi đã tăng tốc đáng kể khả năng của họ để thực hiện các tác vụ với robot này. Chúng tôi không hề huấn luyện Claude để "nâng cao khả năng con người thực hiện các tác vụ robot học". Đây chỉ là một kết quả tự nhiên từ công nghệ này. Và có lẽ về lâu dài, đây là một chỉ báo hàng đầu về hướng đi của toàn bộ hệ thống.
Nhưng ngày nay, nó đòi hỏi sự kết hợp giữa con người và một mô hình AI. Ngày mai, có khả năng chỉ cần mô hình AI. Ảnh hưởng của Trí tuệ nhân tạo (AI) sẽ không chỉ ở phần mềm. Chúng sẽ ở phần cứng và cả trong thế giới vật lý nữa.