Bỏ qua đến nội dung chính

Code with Claude Opening Keynote

TL;DR

  • Khả năng của các mô hình AI như Claude đang tăng trưởng theo cấp số mũ, cho phép giải quyết các tác vụ phức tạp và đẩy nhanh quy trình kỹ thuật đáng kể, từ chuyển đổi mã quy mô lớn đến xác định lỗ hổng bảo mật lâu năm.
  • Tuy nhiên, tồn tại một "khoảng cách triển khai" giữa sự phát triển nhanh chóng của AI và tốc độ áp dụng tuyến tính của hầu hết các tổ chức, làm hạn chế tác động tiềm năng của nó.
  • Các nhà phát triển đóng vai trò trung tâm trong việc thu hẹp khoảng cách này bằng cách xây dựng trên nền tảng AI, và Anthropic đang hỗ trợ họ bằng cách tăng giới hạn tỷ lệ và giới thiệu các khả năng mô hình tiên tiến.

Điểm chính

  • Các mô hình AI đang cải thiện với tốc độ cấp số mũ, thể hiện qua khả năng chuyển đổi 50.000 dòng code Scala sang Java trong 4 ngày và tìm ra lỗ hổng bảo mật 27 năm tuổi trong mã nguồn Open BSD.
  • Có một "khoảng cách triển khai" đáng kể giữa sự tăng trưởng cấp số mũ của khả năng AI và việc áp dụng tuyến tính của các tổ chức, nơi các nhà phát triển là chìa khóa để chuyển đổi khả năng thành giải pháp thực tế.
  • Anthropic đang tăng đáng kể giới hạn tỷ lệ (rate limit) cho các nhà phát triển trên Claude Code (gấp đôi giới hạn 5 giờ) và Claude Opus API để hỗ trợ việc xây dựng và phát triển trên nền tảng của họ.
  • Các mô hình Claude tương lai sẽ có khả năng phán đoán cao hơn, chất lượng code tốt hơn, cửa sổ ngữ cảnh (context windows) gần như vô hạn với bộ nhớ chất lượng cao, và khả năng phối hợp đa tác nhân (multi-agent coordination).
  • Các nhà phát triển nên thiết kế và xây dựng cho các khả năng AI trong tương lai, không chỉ cho các phiên bản mô hình hiện tại, bằng cách tạo ra các nguyên mẫu đầy tham vọng và hệ thống đánh giá tự động (e-val) mạnh mẽ.
  • Việc nâng cấp mô hình là một cơ hội kinh doanh; các đội ngũ tận dụng hiệu quả nhất là những người làm cho việc nâng cấp trở nên dễ dàng và tích hợp các khả năng mới một cách nhanh chóng.
  • Các primitive mới như routines sẽ cho phép Claude Code tự prompt chính nó, tăng cường khả năng tự chủ của tác nhân ngay cả khi không có người dùng tương tác trực tiếp.

Từ vựng

  • tăng trưởng theo cấp số mũ — exponential growth
  • mô hình — model
  • tác nhân — agent
  • API — application programming interface (giao diện lập trình ứng dụng)
  • cửa sổ ngữ cảnh — context window
  • phối hợp đa tác nhân — multi-agent coordination
  • giới hạn tỷ lệ — rate limit
  • khung sườn — scaffolding
  • trường hợp sử dụng — use case
  • e-val — evaluation (đánh giá)

Nội dung chi tiết

Lời Mở Đầu: Hồi Ức Về Lập Trình

Chào buổi sáng tất cả mọi người. Rất vui được gặp tất cả các bạn. Cảm ơn các bạn đã tham gia cùng chúng tôi. Khi tôi nghĩ về lý do tại sao tôi ở đây hôm nay, tôi nhớ lại lần đầu tiên tôi viết một chương trình máy tính và nó hoạt động. Tôi không lớn lên cùng coding. Tôi lớn lên ở vùng đồi núi Appalachians, chưa từng tự xây dựng máy tính riêng hay thậm chí chơi trò chơi điện tử. Lần đầu tiên tôi thực sự cố gắng xây dựng một thứ gì đó phức tạp là trong các lớp khoa học máy tính ở trường đại học. Chuyện này đã rất lâu rồi, chúng tôi phải xếp hàng để đăng nhập trực tiếp vào các server vì đó là những thứ duy nhất đủ mạnh để xử lý các ray tracer của chúng tôi. Một số bạn có thể thấy điều này quen thuộc: tiếng server ù rì, mùi pizza cũ, cà phê và mùi đặc trưng của một phòng lab máy tính không cửa sổ. Tôi vẫn còn nhớ cảm giác khi nhấn nút compile và chờ đợi xem chương trình của mình có hoạt động không. Cảm giác vui sướng, khám phá, một chút nhẹ nhõm, và sự phấn khích khi tôi đã tạo ra một thứ chưa từng tồn tại trên thế giới. Đó là điều đã lôi cuốn tôi, và đó là lý do tôi ở đây ngày hôm nay.

Sức Mạnh Của AI: Từ Cá Nhân Đến Cộng Đồng

Mọi thứ đã thay đổi rất nhiều. Điều mà trước đây tôi chỉ có thể đạt được bằng cách xếp hàng dài tại phòng lab khoa học máy tính ở trường đại học, giờ đây đã có sẵn cho bất kỳ ai, bất kỳ ngày nào trong tuần, ở bất cứ đâu trên thế giới. Không cần xếp hàng, không mùi lạ, không rào cản. Chỉ còn lại cảm giác phấn khích, vui sướng và nhẹ nhõm đó. Tôi biết rất nhiều bạn cũng có cảm giác tương tự. Mọi người luôn nói với tôi: "Tôi cảm thấy như Claude đã ban cho tôi siêu năng lực." Đó là một trong những điều tôi thích nghe nhất. Và chúng tôi đang chứng kiến mọi người sử dụng những sức mạnh đó.

Ví dụ, Scott McVicar điều hành nhóm developer inference tại Stripe. Một trong những nhóm của anh ấy có 50.000 dòng Scala cần được chuyển đổi sang Java trước khi họ có thể nâng cấp JDK. Ước tính ban đầu là 10 tuần engineering. Họ đã sử dụng Claude và hoàn thành chỉ trong bốn ngày.

Và đôi khi, tốc độ không chỉ là hiệu quả. Đó là về những gì đang chờ đợi ở phía bên kia. Felicia Krakuru là đồng sáng lập và CEO của Binti. Phần mềm của cô ấy vận hành các hệ thống mà các nhân viên xã hội sử dụng để đưa trẻ em vào diện chăm sóc nuôi dưỡng. Từ giấy tờ, thăm nhà cho đến quy trình cấp phép. Năm nay, nhóm của cô ấy đã sử dụng Claude API để giúp các nhân viên xã hội lấy lại hàng giờ mà họ từng dành cho công việc giấy tờ. Điều đó đã rút ngắn 20 ngày trong quy trình cấp phép cho một gia đình nuôi dưỡng. 20 ngày! Đó không chỉ là một chỉ số hiệu quả. Đó là một đứa trẻ được kết nối với một gia đình.

Sự phấn khích, vui sướng, nhẹ nhõm, cảm giác khám phá đó là điều tôi nghe được từ mọi người. Tôi đoán rằng mọi người ở đây trải nghiệm điều đó khác nhau. Một số bạn đang sống trên biên giới công nghệ mỗi ngày. Một số bạn đang đồng hành cùng những người xung quanh. Và một số bạn đến đây vì, giống như tôi, bạn có thể cảm thấy mặt đất đang dịch chuyển dưới chân chúng ta và bạn muốn có cái nhìn về những gì sắp tới. Tin tôi đi, tôi cảm thấy tất cả những điều đó thường xuyên, ngay cả trong cùng một buổi sáng. Tôi đến làm việc với một kế hoạch và sau đó tôi phải xé bỏ nó trước giờ ăn trưa vì một điều gì đó mới đã xảy ra. Điều đó nghe có vẻ quen thuộc.

Tăng Trưởng Theo Cấp Số Mũ Của AI và Khoảng Cách Triển Khai

Và bạn biết đấy, điều đó hợp lý khi chúng ta nhìn lại tốc độ cải thiện của các mô hình này. Tại Anthropic, chúng tôi nói rất nhiều về tăng trưởng theo cấp số mũ. Và tôi nghĩ đó là điều chúng ta đang cảm nhận ngay bây giờ. Hãy nhớ lại vài năm trước, biên giới phát triển mô hình là một thứ gì đó đủ tốt để viết một email tử tế. Và chúng tôi đã khá hài lòng về điều đó. Một năm trước, chúng tôi đứng trên sân khấu này, Opus 4 là tiêu đề chính. Và ý tưởng rằng một tác nhân có thể chạy trong một giờ mà không cần con người kiểm tra đã có vẻ là một mục tiêu xa vời. Nhưng rồi sáu tháng trước, các tác nhân đã chạy end-to-end qua đêm, vì vậy chúng tôi thức dậy với công việc đã hoàn thành. Và rồi tháng trước, Mythos đã đọc toàn bộ cây mã nguồn Open BSD và tìm thấy một lỗ hổng 27 năm tuổi đã tồn tại qua mọi người code review của con người, mọi fuzzer, mọi static analyzer được áp dụng trong gần ba thập kỷ. Những bước nhảy vọt ngày càng lớn hơn và khoảng thời gian giữa chúng ngày càng ngắn hơn.

Nhưng mặc dù khả năng của mô hình đang cải thiện theo cấp số mũ, hầu hết các tổ chức vẫn đang áp dụng AI theo một con đường tuyến tính. Và điều đó có nghĩa là có một khoảng cách giữa những gì AI có thể làm và những gì nó thực sự đang làm cho mọi người. Thu hẹp khoảng cách đó, chuyển đổi khả năng của mô hình thành thứ mà người thật sử dụng để giải quyết vấn đề của họ – đó là những gì các nhà phát triển làm. Đó là điều mà tất cả các bạn đang làm. Và chúng tôi đang chứng kiến điều đó xảy ra.

Năm này qua năm khác, khối lượng API tăng gần 17 lần trên nền tảng Claude. Và trên Claude Code, nhà phát triển trung bình hiện đang dành 20 giờ mỗi tuần để chạy Claude.

Giống như các bạn, gần đây chúng tôi đã shipping rất nhiều. Nhưng chúng tôi muốn các bạn rời khỏi đây hôm nay với một bức tranh rõ ràng về hướng đi của chúng tôi. Để các bạn có thể lập kế hoạch và cùng chúng tôi cưỡi lên làn sóng tăng trưởng theo cấp số mũ này.

Tôi muốn nói trước rằng chúng tôi không có một mô hình mới nào để công bố. Hôm nay là về cách chúng tôi đang làm cho các sản phẩm của mình hoạt động tốt hơn cho các bạn. Để các bạn có thể thu hẹp khoảng cách cho phần còn lại của thế giới. Sáng nay, chúng tôi sẽ cho các bạn thấy điều đó trông như thế nào.

Đầu tiên, Diane sẽ nói về nền tảng của chúng tôi, model layer. Cô ấy sẽ chia sẻ thêm về các mô hình tiên phong (frontier models) của chúng tôi và những gì sắp tới. Trên nền tảng Claude, chúng tôi đang shipping các bản cập nhật cho tác nhân được quản lý bởi Claude, các outcome, dreamingmulti-agent orchestration (điều phối đa tác nhân). Và Angelin, Caitlin, sẽ hướng dẫn các bạn cách nền tảng xử lý hạ tầng để các bạn không phải làm điều đó.

Và trên Claude Code, Cat và Boris sẽ hướng dẫn các bạn cách sử dụng các primitive mới như routines để Claude Code có thể tự prompt chính nó, ngay cả khi các bạn không ở cạnh máy tính. Nhưng tất cả điều này quay trở lại với các bạn và những gì các bạn sẽ xây dựng. Bởi vì hầu hết mọi người sẽ không bao giờ gọi Claude API. Họ sẽ không bao giờ mở một terminal và gõ Claude. Họ sẽ trải nghiệm AI thông qua một thứ mà một trong số các bạn đã xây dựng trên nền tảng Claude. Cho dù đó là một nhà thiết kế đang khám phá những hướng đi mới với Canva, hay một luật sư hoàn thành một bản tóm tắt nhanh hơn với LaGora, hay một nhà phát triển sử dụng bất kỳ tác nhân code tốt nhất thế giới nào.

Vì vậy, cảm ơn các bạn. Tất cả các bạn định hình cách AI được cảm nhận bởi mọi người khác. Chúng tôi sẽ không bao giờ có thể xây dựng mọi thứ mà mọi người cần để giải quyết vấn đề của họ. Đó là điều mà chỉ tất cả các bạn mới có thể làm được.

Hỗ Trợ Cộng Đồng Phát Triển và Tăng Giới Hạn Tỷ Lệ

Và một cách chúng tôi muốn thể hiện lòng biết ơn là bằng cách chia sẻ một tin tức thú vị. Kể từ hôm nay, chúng tôi đang tăng giới hạn tỷ lệ (rate limit) cho các nhà phát triển trên Claude Code và nền tảng Claude để giúp các bạn tiếp tục xây dựng và thu hẹp khoảng cách đó cho thế giới. Cụ thể hơn, chúng tôi đang tăng gấp đôi giới hạn tỷ lệ 5 giờ của Claude Code cho các gói Pro, Max, TeamEnterprise dựa trên C. Và chúng tôi đang tăng đáng kể giới hạn API cho Claude Opus. Chúng tôi thực hiện điều này bằng cách mở rộng các đối tác tài nguyên tính toán (compute) của mình. Chúng tôi đang hợp tác với SpaceX để sử dụng toàn bộ dung lượng của trung tâm dữ liệu Colossus One của họ. Và chúng tôi đang đầu tư trực tiếp vào các nhà phát triển cá nhân và các nhóm nhỏ. Theo thời gian, chúng tôi sẽ tiếp tục khám phá mọi cách để giúp các bạn tận dụng tối đa Claude, bao gồm cả các nỗ lực tài nguyên tính toán hiện có và những cam kết táo bạo hơn nữa.

Vì vậy, cảm ơn các bạn đã có mặt ở đây hôm nay. Cảm ơn các bạn đã hợp tác cùng chúng tôi để định hình AI trông như thế nào đối với thế giới. Cảm ơn các bạn đã mang lại siêu năng lực cho mọi người. Tiếp theo là Diane, người đứng đầu nhóm PM nghiên cứu của chúng tôi. Cảm ơn. Cảm ơn Ami.

Chặng Đường Phát Triển Mô Hình Claude

Tôi là Diane và tôi đã gia nhập Anthropic vào năm 2023. Tôi đã tham gia vào mọi mô hình kể từ Claude 2. Với những ai đang theo dõi, đó là việc mang 18 phiên bản Claude thuộc các dòng Haiku, Sonnet, Opus và giờ là Mythos đến tay người dùng và các nhà phát triển như các bạn.

Chúng tôi đã nỗ lực để Opus 3 trở nên xuất sắc trong việc tuân thủ JSON và cũng là mô hình tốt nhất trong việc viết code dạng dài. Với Sonnet 3.5 mới, hay như chúng ta giờ đây đều biết là Sonnet 3.6, chúng tôi đã dạy Claude cách sử dụng máy tính một cách an toàn. Và với Sonnet 3.7, phiên bản có xu hướng hơi quá nhiệt tình một chút, chúng tôi đã tìm ra cách đúng đắn để giới thiệu nó cho người dùng và các nhà phát triển, để các bạn có thể tận dụng tối đa Claude. Thời điểm này năm ngoái, chúng tôi đã sử dụng Claude 4 để có thể sử dụng các dial tư duy (thinking dials) một cách hiệu quả và để giải quyết test time compute.

Và chúng tôi vẫn không ngừng lại. Trong 12 tháng qua, chúng tôi đã shipping tám mô hình tiên phong (frontier models) cho các nhà phát triển và người dùng. Mỗi mô hình đều xây dựng dựa trên mô hình trước đó, cho phép các bạn viết code tốt hơn và các sản phẩm các bạn xây dựng tiến xa hơn bao giờ hết. Model layer là nền tảng cho mọi thứ khác mà các bạn sẽ nghe hôm nay. Và đó là mấu chốt: khi trí thông minh của mô hình tăng lên, điểm xuất phát của bạn cũng tiến lên. Và bạn có thể làm được nhiều hơn bao giờ hết.

Ý Nghĩa Của Tăng Trưởng Theo Cấp Số Mũ Trong Nghiên Cứu AI

Chúng tôi nói nhiều về tăng trưởng theo cấp số mũ tại Anthropic. Các bạn cũng đã nghe Ami nhắc đến một chút. Đối với tôi, tăng trưởng theo cấp số mũ có nghĩa là khi trí thông minh của mô hình tăng lên, các trường hợp sử dụng (use case) mà bạn có thể xây dựng và cung cấp cho người dùng cũng tăng lên theo cấp số mũ. Chẳng hạn, lập trình tác nhân (agentic coding) có tác động lớn hơn nhiều so với tự động hoàn thành mã (code autocomplete). Và theo cách này, các sản phẩm và trải nghiệm mới sẽ tạo ra thị trường mới, làm tăng lợi ích cho tất cả mọi người.

Trong nghiên cứu, chúng tôi không coi tăng trưởng theo cấp số mũ chỉ là những con số tăng vọt. Nó còn là việc tạo ra và theo dõi các khả năng mà trước đây chưa từng tồn tại cho đến khi chúng tôi thiết kế và tạo ra chúng. Ví dụ như sử dụng công cụ (tool use), sử dụng máy tính, tư duy thích ứng với vấn đề, vòng lặp tác nhân (agentic loops) có thể duy trì một kế hoạch qua hàng trăm hoặc hàng ngàn bước, và cửa sổ ngữ cảnh (context windows) dài giúp dạy Claude những kiến thức mà nó chưa từng có trước đây.

Và những khả năng này không chỉ dừng lại ở code. Ngày nay, Claude có thể tạo và lặp lại các thiết kế trực quan, phân tích và tạo ra các sản phẩm công việc (work deliverables) phức tạp, cũng như điều hướng các lĩnh vực kinh doanh mà bạn có thể tham gia theo những cách mởrộng lớn. Điều đó là do trí thông minh của mô hình – nền tảng cốt lõi – đã đủ thông minh và đủ mạnh để hỗ trợ tất cả những điều này. Khi bạn xây dựng trên Claude, bạn đang xây dựng trên dòng mô hình đã tạo ra những khả năng này đầu tiên và có nhiều thời gian nhất để biến chúng trở nên đáng tin cậy.

Claude Opus 47 và Hướng Đi Tương Lai

Để làm rõ hơn, hãy cùng xem mô hình mới nhất của chúng tôi, Opus 47. AMP, tác nhân code, đã chuyển toàn bộ chế độ thông minh của họ sang Opus 47 vì nó đạt điểm cao nhất trong các điểm chuẩn (benchmark) của họ, và họ có thể đơn giản hóa các công cụ (tooling) của mình, thay đổi khung sườn (scaffolding) vì mô hình không còn cần sự trợ giúp nữa. Rakuten đã chạy nó trên các điểm chuẩn của họ và giải quyết số lượng tác vụ kỹ thuật môi trường sản phẩm (production engineering tasks) gấp ba lần so với trước đây. Và cuối cùng, Opus 47 có thể tự nhận diện các lỗi logic trong giai đoạn lập kế hoạch, tìm ra lỗi sai, quay lại, giải quyết, cuối cùng dẫn đến việc thực thi nhanh hơn và sạch hơn.

Ngay sau khi chúng tôi ra mắt Opus 47, chúng tôi đã ra mắt Claude Design bởi Anthropic Labs, một trong những lần ra mắt yêu thích của tôi trong năm nay. Mọi người đã và đang xây dựng giao diện môi trường sản phẩm (production interfaces) bằng cách kết hợp Claude DesignClaude Code. Điều này là do Opus 47 có cảm quan thực sự về thiết kế trực quan, thể hiện đúng các sắc thái trong khi vẫn tuân thủ các nguyên tắc thiết kế của bạn. Và chúng tôi cũng nghe từ người dùng hàng ngày rằng mọi người thích sử dụng Claude vì nó hiểu toàn bộ nhiệm vụ và có thể nhận ra khi nào cần phản bácđặt câu hỏi về các giả định.

Đồng thời, như mỗi chúng ta đều đã biết khi xây dựng trên các hệ thống này, các mô hình vẫn chưa hoàn thiện và đang trong quá trình phát triển. Chúng đôi khi vẫn có thể bị vướng mắc bởi những điều rất cơ bản và cũng có thể mất phương hướng khi bạn đưa vào quá nhiều ngữ cảnh. Đó là điều làm cho nó trở nên thú vị và cảm ơn các bạn đã cùng chúng tôi trên hành trình này.

Dưới đây là một chút về những gì chúng tôi đang phát triển và những gì sắp tới. Thứ nhất, khả năng phán đoán cao hơnchất lượng code tốt hơn. Điều này có nghĩa là các phiên bản Claude mà bạn có thể tin cậy với các công việc kỹ thuật phức tạp, tự chủ. Thứ hai, cửa sổ ngữ cảnh (context windows) mà cảm giác như vô hạn khi kết hợp với bộ nhớ chất lượng cao. Để bạn có thể thực hiện một tác vụ chạy dài mà vẫn nhận được kết quả tốt hơn. Và cuối cùng, phối hợp đa tác nhân (multi-agent coordination), cung cấp sức mạnh cho các đội tác nhân và các phiên bản Claude cộng tác để đạt được những mục tiêu lớn mà bất kỳ phiên bản đơn lẻ nào cũng không thể đạt được.

Cách tôi nghĩ về tiến bộ trong trí thông minh của mô hìnhtầm nhìn tác vụ (task horizon), đây là một thước đo về thời gian một phiên bản Claude hoặc một mô hình có thể làm việc một cách tự chủ trong khi cải thiện các sản phẩm đầu ra (deliverables) và chất lượng công việc của nó. Thời điểm này năm ngoái, các mô hình có thể làm việc trong vài phút. Bây giờ, hầu hết các bạn và tôi có lẽ đều có các tác nhân đang chạy hàng giờ liền.

Triển Vọng Về Tác Nhân và Mô Hình Tương Lai

Và trong tương lai, chúng ta sẽ có các tác nhân chủ động, luôn hoạt động và biết cần làm gì mà không bị lạc hướng. Vậy với tư cách là các developer, chúng ta nên nhìn nhận tất cả những điều này như thế nào? Tăng trưởng theo cấp số nhân sẽ tiếp tục được cải thiện. Và bạn cần xây dựng cho những khả năng đang nổi lên, không chỉ cho các phiên bản Claude hiện tại. Điều này là bởi vì các mô hình mới sẽ có năng lực vượt trội hơn nhiều so với những gì chúng ta có thể tiếp cận ngày nay. Trước đây, chúng ta phải xây dựng khung sườn để duy trì mỗi phiên bản Claude. Còn bây giờ, khung sườn được dùng để thực sự khuếch đại tư duy của mô hình. Chúng ta từng phải thiết kế các vòng lặp phức tạp, cung cấp công cụ phù hợp, tìm cách thực hiện các lần thử lại. Và giờ đây, tất cả những điều đó có thể được tích hợp vào tư duy và cách thực thi đúng đắn ngay trong mô hình.

Bạn đã thấy được tiềm năng của nó. Opus Preview, Missos, là điểm tiếp theo của tăng trưởng theo cấp số nhân đó. Và đây không phải là một bước nhỏ. Do đó, cách tất cả chúng ta làm việc với mô hình và Claude cần phải thay đổi. Đây là một số điều chúng tôi cân nhắc tại Anthropic. Thứ nhất, bạn cần thiết kế cho phiên bản Claude tiếp theo, chứ không chỉ phiên bản hiện tại. Chúng tôi đã thấy vô số lần rằng các developer chiến thắng là những người tối ưu hóa kiến trúc của họ để tiếp nhận bước nhảy vọt về tư duy tiếp theo, chứ không chỉ là độ chính xác tăng dần của ngày hôm nay. Điều này có nghĩa là duy trì và tạo ra các e-val (đánh giá) khó hơn, xây dựng các nguyên mẫu đầy tham vọng mà bạn nghĩ có thể không hoạt động ngày hôm nay. Bởi vì đó là cách bạn sẽ nhận ra khi tăng trưởng theo cấp số nhân đang được cải thiện và phát triển dưới chân bạn. Đó là một điều trước đây không hiệu quả, nhưng đột nhiên lại vượt qua. Đó là dấu hiệu cho thấy bạn có thể có một thứ gì đó kỳ diệu để mang đến cho người dùng của mình, thứ mà trước đây không hoạt động.

Và đây là những gì các đội ngũ tận dụng tối đa Claude đã nhận ra: Nâng cấp mô hình là một cơ hội kinh doanh. Các đội ngũ khai thác hiệu quả nhất các mô hình Claude là những người giúp việc nâng cấp trở nên rẻ. Điều này bao gồm các e-val tự động, khung sườn đơn giản, và các nguyên mẫu đầy tham vọng cùng việc sử dụng các khả năng mà người khác chưa hình dung ra. Chúng tôi tin rằng tăng trưởng theo cấp số nhân trên slide một sẽ tiếp tục diễn ra như vậy. Khi tư duy của mô hình tăng lên, các developer Hoa Kỳ có cơ hội đi trước để thử nghiệm xây dựng các use case mới, tạo ra các sản phẩm mới thú vị cho người dùng của bạn, và cuối cùng là tạo ra các thiết kế và thị trường mới, từ đó mở rộng thị trường. Mọi thứ mà Caitlin và Angela sắp trình bày sẽ cung cấp cho bạn công cụ để biến tất cả những điều này thành hiện thực và có thể thực thi được. Cảm ơn rất nhiều vì đã có mặt tại đây.

Thách Thức và Giải Pháp Khi Tận Dụng Mô Hình

Vậy, khả năng của mô hình đang ở mức tăng trưởng theo cấp số nhân, nhưng các doanh nghiệp vẫn đang hoạt động theo tuyến tính. Do đó, với tư cách là một doanh nghiệp, điều quan trọng hơn bao giờ hết là đảm bảo bạn thực sự có thể khai thác sức mạnh của tăng trưởng theo cấp số nhân đó. Nhưng điều gì đang cản trở các doanh nghiệp thực sự nắm bắt được điều này? Thực ra, nó quy về hai vấn đề chính. Vấn đề đầu tiên là đạt được các kết quả mong muốn. Việc đạt được kết quả mong muốn vẫn còn quá khó khăn. Bạn phải thực hiện rất nhiều công việc tối ưu hóa lời nhắc, xây dựng công cụ, kỹ thuật kiểm soát. Vẫn còn rất nhiều công sức cần bỏ ra để thực sự định hướng mô hình đến đúng nơi bạn cần. Đúng vậy.

Và vấn đề thứ hai là bạn muốn triển khai nhanh chóng, nhưng đồng thời cũng muốn triển khai một cách có thể mở rộng. Mọi người trong ngành công nghệ đang di chuyển với tốc độ cực nhanh hiện nay, và bạn phải theo kịp. Nhưng để thắng, bạn cũng cần chất lượng. Việc triển khai các nguyên mẫu thì rất dễ, nhưng việc mở rộng quy mô trong môi trường sản phẩm thì lại rất khó.

Nền Tảng Claude và Các Giải Pháp

Vì vậy, chúng tôi đã xây dựng một nền tảng Claude để cung cấp cho bạn mọi thứ cần thiết nhằm đạt được những kết quả tuyệt vời đó và triển khai với tốc độ, khả năng mở rộng đồng thời. Nền tảng này đi kèm với các API primitives được tinh chỉnh cho các mô hình Claude. Nó cung cấp cho bạn cơ sở hạ tầng để xây dựngmở rộng các hệ thống tác nhân. Và nó cung cấp cho bạn các điều khiển để vận hành những hệ thống đó. Đúng vậy.

Vậy nếu chúng ta quay lại các tuyên bố về vấn đề mà chúng tôi thường xuyên nghe từ các doanh nghiệp khác nhau, một trong những điều phổ biến nhất mà Kaelin và tôi luôn nghe là các doanh nghiệp cần tư duy cao, nhưng tất nhiên là với chi phí thấp hơn. Vì vậy, một trong những cách chúng tôi giải quyết vấn đề này là với chiến lược cố vấn. Điều này thực sự dễ thực hiện. Tất cả những gì bạn phải làm là cập nhật mảng công cụ của bạn bên trong API tin nhắn. Và điều chúng tôi đang làm là thực sự cung cấp một kiến trúc tác nhân tách biệt việc thực thi khỏi việc tư vấn. Vì vậy, trong thực thi, bạn có thể chọn một mô hình nhỏ hơn. Nó sẽ rẻ hơn một chút. Nhưng sau đó, mô hình nhỏ đó khi cần lời khuyên về việc phải làm gì tiếp theo, nó thực sự có thể tìm đến một mô hình lớn hơn để được giúp đỡ.

Vâng, trên thực tế, điều này có nghĩa là bạn có thể sử dụng mô hình lớp Haiku hoặc Sonnet để thực thi, và Opus làm cố vấn. Khi chúng tôi chạy thử nghiệm với Sonnet thực thi và Opus tư vấn, chúng tôi thấy Sonnet hoạt động tốt hơn nhiều so với việc chỉ có Sonnet. Nhưng quan trọng hơn, chúng tôi thấy Sonnet hoạt động hiệu quả về chi phí hơn đáng kể so với khi hoạt động một mình, vì Opus đã có thể đưa ra lời khuyên để nó hoàn thành công việc tốt hơn. Một ví dụ điển hình cho điều này là EVE legal. EVE legal đã sử dụng chiến lược cố vấn. Và họ cho chúng tôi biết rằng họ đã đạt được chất lượng mô hình tiên tiến với chi phí thấp hơn năm lần. Vâng, và điều đó thật tuyệt vời. Chúng tôi thích những điều như thế này, bởi vì bạn có thể sử dụng nó trong các mô hình như freemium. Khi bạn cung cấp những loại trải nghiệm freemium này cho người dùng, bạn phải nhận thức được chi phí mình sẽ phải chịu. Nhưng rõ ràng, bạn muốn đảm bảo họ có một trải nghiệm tốt. Nó cũng rất hữu ích cho những lĩnh vực có khối lượng công việc cực kỳ lớn. Và tất nhiên, bạn sẽ phải chú ý một chút đến ROI (lợi tức đầu tư) của mình.

Tăng Tốc Triển Khai và Mở Rộng Quy Mô

Vậy tất cả những điều đó đều tuyệt vời. Nhưng còn về tốc độ và khả năng mở rộng thì sao? Hai điều mà Katelyn đã đề cập là rất khó đạt được cùng lúc. Gần đây nhất, chúng tôi đã giới thiệu Claude Managed Agents. Claude Managed Agents là một khung tác nhân được kết hợp với cơ sở hạ tầng cấp môi trường sản phẩm. Các đội ngũ có thể chuyển đổi từ nguyên mẫu sang môi trường sản phẩm chỉ trong vài ngày. Các đội ngũ mà chúng tôi đã làm việc cùng đã có thể triển khai nhanh hơn gấp 10 lần với managed agents.

Một điều tuyệt vời khác mà chúng tôi yêu thích ở managed agents là nó tích hợp sẵn rất nhiều thực hành tốt nhất. Ví dụ, khi bạn xây dựng một tác nhân, một trong những thực hành tốt nhất bạn muốn đảm bảo thực hiện là, tất nhiên, cung cấp cho nó bộ nhớ. Bằng cách đó, tác nhân sẽ lưu giữ tùy chọn người dùng và nó sẽ ghi nhớ sát hơn với những gì bạn muốn làm trong mỗi phiên. Khá khó để xây dựng bộ nhớ. Và đây là một ví dụ về một thực hành tốt nhất mà chúng tôi thực sự tích hợp sẵn và nó được tự động tinh chỉnh cho Claude. Và chúng tôi muốn đảm bảo mọi người đều nghe rõ điều này. Khi chúng tôi cung cấp bộ nhớ cho bạn, bộ nhớ đó cuối cùng vẫn là của bạn. Vì vậy, bạn có thể lấy và nhập nó vào bất cứ đâu bạn muốn.

Một trong những ví dụ yêu thích của chúng tôi về việc xây dựng trên managed agentsNotion. Notion muốn xây dựng với tốc độ và khả năng mở rộng đồng thời, vì vậy họ đã chọn xây dựng trên managed agents. Và họ đã xây dựng khả năng để bạn có thể kích hoạt các tác nhân Claude trực tiếp trong trải nghiệm sản phẩm của họ cho các tác vụ tự động phức tạp, chạy dài hạn. Vâng, và chúng tôi yêu thích tính năng đó. Thật tuyệt vời. Được rồi, hôm nay chúng tôi đang nâng cấp Claude Managed Agents với ba tính năng thực sự mạnh mẽ. Chúng tôi sẽ giới thiệu điều phối đa tác nhân để bạn thực sự có thể tạo ra đội hình tác nhân để giải quyết các tác vụ thực sự phức tạp. Chúng tôi sẽ giới thiệu kết quả cho phép bạn đặc tả chính xác điều gì là thành công. Và sau đó, Claude sẽ lặp đi lặp lại cho đến khi hoàn thành. Và chúng tôi sẽ giới thiệu Dreaming. Chúng tôi thực sự hào hứng về tính năng này. Nhưng với Dreaming, Claude thực sự có khả năng tự học. Nó có thể xem xét các phiên trước đó của mình, tìm ra những kỹ năng mà nó đã bỏ lỡ, những bài học đáng lẽ phải học, và thực sự tự áp dụng những điều đó trực tiếp vào bộ nhớ của nó.

Trình Diễn Trực Tiếp: Bumara – Hạ Cánh Drone Lên Mặt Trăng

Nhưng thay vì chỉ trình bày tất cả những điều này, nói chuyện với bạn về chúng, chúng tôi thực sự sẽ trình diễn trực tiếp cho bạn thấy những điều này trông như thế nào. Được rồi, hãy làm điều đó. Chúng ta bắt đầu thôi. Caitlin và tôi đã được truyền cảm hứng từ một số thông báo trước đó trong ngày hôm nay. Có giới hạn tỷ lệ API lớn hơn cho Opus. Và gần đây nhất, chúng tôi đã hợp tác với một công ty không gian cụ thể. Vì vậy, chúng tôi được truyền cảm hứng để thành lập một công ty khởi nghiệp nhỏ của riêng mình, một công ty hư cấu để rõ ràng hơn, có tên là Bumara. Và với Bumara, chúng tôi quyết định, tại sao chúng ta không xây dựng một phần mềm tác nhân giúp chúng ta tự động hạ cánh máy bay không người lái trên mặt trăng? Và chúng tôi thực sự quan tâm đến tốc độ và khả năng mở rộng cùng một lúc. Vì vậy, rõ ràng, chúng tôi sẽ xây dựng điều này trên Claude Managed Agents. Chính xác.

Vậy, giả sử chúng ta tìm được khách hàng đầu tiên. Và khách hàng giả định này muốn hạ cánh máy bay không người lái lên mặt trăng để khai thác các vật liệu giả định. Đây là một công việc lớn đầy tham vọng. Và bất chấp mọi ước mơ của chúng tôi, chúng tôi thực sự không phải là kỹ sư hàng không vũ trụ. Vì vậy, chúng tôi sẽ cần những tác nhân thực sự tuyệt vời để hoàn thành công việc này. Do đó, chúng tôi sẽ tích hợp cả ba tính năng mới mà chúng tôi vừa nói đến. Và chúng tôi đã làm điều này cho khách hàng đầu tiên của mình. Và tôi sẽ cho bạn thấy cách chúng tôi thiết lập nó bằng cách sử dụng công cụ dòng lệnh Claude API CLI.

Điều Phối Đa Tác Nhân và Thiết Lập Mục Tiêu

Vậy trước hết, đây là một công việc lớn. Vì vậy, chúng tôi thực sự muốn nhiều tác nhân giúp chúng tôi hoàn thành công việc này. Tôi sẽ trình bày cho bạn các tác nhân mà chúng tôi đã thiết lập cho khách hàng của mình. Đầu tiên, chúng tôi có một tác nhân chỉ huy, và nhiệm vụ của tác nhân chỉ huy này là đảm bảo toàn bộ nhiệm vụ diễn ra tốt đẹp. Sau đó, chúng tôi có một tác nhân dò tìm. Và nhiệm vụ của tác nhân dò tìm là đảm bảo chúng tôi tìm thấy các địa điểm hạ cánh có vật liệu khai thác chất lượng cao. Và rồi chúng tôi có tác nhân điều hướng. Tác nhân điều hướng đảm bảo chúng tôi hạ cánh máy bay không người lái an toàn và bay chúng đến đích.

Vì vậy, tôi sẽ thiết lập tác nhân chỉ huy của chúng tôi làm người điều phối cho hai tác nhân còn lại. Và khi điều này chạy, điều thực sự xảy ra là tác nhân chỉ huy đang khởi tạo một phiên. Và sau đó, đối với mỗi tác nhân phụ này, chúng có các luồng độc lập riêng để chúng có các cửa sổ ngữ cảnh độc lập. Đây là một thiết kế rất có chủ đích. Và chúng tôi nhận thấy rằng bằng cách thực hiện điều này cùng nhau, sau đó hợp nhất tất cả các kết quả, chúng tôi đạt được hiệu suất tốt hơn. Chính xác. Đó là về đa tác nhân.

Bây giờ, hãy tích hợp kết quả. Cách kết quả hoạt động là chúng tôi muốn đảm bảo khách hàng của mình, những người có tiêu chí rất cụ thể về những gì họ muốn đạt được, có thể định nghĩa các tiêu chí đó. Và sau đó, chúng tôi có thể cung cấp một tác nhân đánh giá thực sự đảm bảo chúng tôi đạt được kết quả đó. Và các kết quả thực ra bắt đầu với một tệp Markdown khá đơn giản. Vì vậy, ở đây bạn có thể thấy một tệp Markdown, một lần nữa, rất, rất đơn giản. Và nó chỉ phác thảo các tiêu chí này cho chúng ta biết liệu một lần chạy có thành công hay không. Chúng tôi muốn máy bay không người lái của mình hạ cánh nhẹ nhàng. Chúng tôi muốn chúng hạ cánh trên mặt đất trống. Và điều khá quan trọng, thực ra, chúng tôi muốn có đủ nhiên liệu và dự trữ để chúng tôi có thể đưa máy bay không người lái của mình trở về Trái đất một cách an toàn.

Vì vậy, để thực sự thiết lập thang đánh giá này cho kết quả của chúng tôi, tôi sẽ gửi một sự kiện đến phiên của chúng tôi để định nghĩa thang đánh giá này là kết quả của chúng tôi. Vâng. Khi điều này đang chạy, như Caitlin đã đề cập, chúng tôi thực sự tạo ra một trình đánh giá riêng biệt. Và tác nhân đánh giá này đang đánh giá xuyên suốt phiên để xem liệu trong mỗi lần chạy, chúng tôi có thực sự đáp ứng thang đánh giá đã được đặc tả hay không. Tất nhiên, nó có thể thực hiện một lần nhưng nhiều khả năng, nó cần lặp lại qua một vài phiên để hoàn thành. Và như Caitlin đã nhấn mạnh ở đây, bạn có thể đặc tả số lần lặp tối đa mà bạn muốn cho phép điều này thực hiện.

Vì vậy, chúng tôi đã tích hợp đa tác nhân, chúng tôi đã tích hợp kết quả, và đã đến lúc kiểm thử. Khách hàng của chúng tôi đã cung cấp cho chúng tôi dữ liệu về sáu địa điểm giả định mà họ có thể muốn hạ cánh máy bay không người lái để chúng tôi chạy một số phiên mô phỏng và xem điều gì xảy ra. Vì vậy, tôi sẽ chuyển sang bảng điều khiển Bumara, nơi bạn có thể thấy rằng tôi đã chạy một mô phỏng trên sáu địa điểm này. Vâng, và điều này khá tốt.

Tối Ưu Hóa Hệ Thống Với Dreaming

Đây là một lần chạy duy nhất với toàn bộ hệ thống của chúng tôi. Nó có kiến trúc đa tác nhân, tích hợp tính năng outcomes. Bạn có thể thấy ở đây rằng nó đã giải quyết đúng bốn trong số sáu vị trí. Nhưng rõ ràng, nó có thể làm tốt hơn một chút ở vị trí ba và vị trí bốn. Giống như bất kỳ hai nhà sáng lập giỏi nào, chúng tôi rõ ràng muốn hill climb trên hệ thống này. Thông thường, hill climbing là một quá trình khá khó khăn. Bạn phải cùng nhau thực hiện rất nhiều công việc để làm điều đó. Nhưng chúng tôi sẽ chỉ cho bạn cách chúng tôi hill climbing trên hệ thống này chỉ bằng dreaming.

Quá Trình Dreaming

Chúng tôi đã chạy mô phỏng này vào hôm qua. Chúng tôi không hoàn toàn hài lòng với kết quả của mình. Và chúng tôi đã vào Claude Developer Console, vào giao diện dreaming của mình. Bạn có thể thấy tôi thực sự chỉ cần nhấn nút nhỏ này có nội dung "dream". Chọn một kho lưu trữ bộ nhớ nơi một tác nhân dreaming có thể xem xét tất cả các phiên mô phỏng trước đây và ghi lại kiến thức của nó vào bộ nhớ để tất cả các phiên mới của chúng tôi thực sự có thể tham chiếu những kiến thức đó trong bộ nhớ để làm tốt hơn. Vì vậy, tôi đã làm điều này đêm qua. Và đây là giấc mơ đã chạy của chúng tôi. Bạn có thể thấy rằng chúng tôi đã ghi rất nhiều thứ vào bộ nhớ, điều này thật tuyệt vời. Và quan trọng nhất, tác nhân thực sự đã chọn viết một playbook giải quyết để tất cả các phiên bổ sung mà chúng tôi chạy trong tương lai sẽ có playbook này để tham khảo, bao gồm tất cả các loại heuristics từ các nhiệm vụ khác nhau mà nó đã chạy trước đó. Đây là một playbook thực sự mạnh mẽ chứa một loạt thông tin mà chúng tôi có thể sử dụng.

Kết Quả Nâng Cấp Hệ Thống

Việc này đã chạy qua đêm. Sáng nay, tôi quay lại dashboard của Lumara và chạy một mô phỏng mới sau khi hệ thống của chúng tôi đã được nâng cấp. Và điều đó thật tuyệt vời. Chúng tôi thực sự đã có thể hill climb và không chỉ không giảm sút ở những phần mà chúng tôi đã quan tâm, mà hai vị trí có thể cải thiện thực sự đã được cải thiện. Và để hill climb trên hệ thống này, tất cả những gì chúng tôi phải làm là nhờ Caitlin nhấn một nút trong console có tên là Dream.

Giới Thiệu Claude PlatformClaude Code

Tuyệt vời! Hãy cùng tóm tắt. Mọi thứ chúng tôi đã trình diễn trực tiếp hôm nay trong bản demo này đều có sẵn trên Claude platform để tất cả các bạn có thể xây dựng. Multi-agent orchestration, outcomesdreaming hiện đang làm cho các primitive của Claude Managed Agents trở nên mạnh mẽ hơn rất nhiều, để bạn có thể sử dụng chúng để xây dựng các hệ thống agentic sâu sắc, mạnh mẽ và có thể mở rộng. Cho dù bạn đang hạ cánh máy bay không người lái lên các tấn mặt trăng hay đang xây dựng doanh nghiệp lớn tiếp theo, Claude Managed Agents luôn sẵn sàng giúp bạn xây dựng các hệ thống agentic mà bạn cần và giải quyết các vấn đề mà bạn đang tìm kiếm.

Bây giờ, chúng tôi muốn chuyển lời cho Kat và Boris, những người sẽ cho bạn thấy Claude Code đang giúp việc phát triển trở nên thú vị hơn như thế nào. Cảm ơn. Angela và Caitlin vừa chỉ cho bạn cách Claude Platform thu hẹp khoảng cách giữa những gì các mô hình có thể làm và những gì tác nhân cần ship cho doanh nghiệp. Chúng tôi có một thử thách tương tự với Claude Code. Chúng tôi cũng muốn thu hẹp khoảng cách giữa khả năng của mô hình và những gì mọi nhà phát triển thực sự có thể làm với chúng.

Lý Do Claude Code Ra Đời

Trước tiên, tôi muốn cảm ơn tất cả các nhà phát triển có mặt tại đây. Cảm ơn bạn đã tin tưởng Claude Code trên các cơ sở dữ liệu môi trường sản phẩm của bạn khi Sonic 3.7 là mô hình tiên phong của chúng tôi, và sản phẩm của chúng tôi còn hơi "thô sơ". Sự hỗ trợ của bạn là điều khiến nhóm của chúng tôi rất hào hứng khi đến làm việc mỗi ngày và làm cho Claude Code ngày càng tốt hơn.

Hãy bắt đầu với lý do Claude Code tồn tại. Phát triển phần mềm đang được tái tạo trong thời gian thực. Nhiệm vụ của Claude Code là thu hẹp khoảng cách giữa những ý tưởng tuyệt vời mà tất cả các bạn có và việc ship một sản phẩm ra thị trường. Và cách chúng tôi thực hiện điều này là xây dựng các công cụ khai thác trí thông minh tiên tiến từ các mô hình của chúng tôi và làm cho chúng có thể tiếp cận được với mọi builder. Chúng tôi không coi mình có một lộ trình roadmap hoàn chỉnh cho bạn. Chúng tôi nghĩ mình giống những người leo núi hơn, cùng bạn leo lên những địa hình mà chưa ai trong chúng ta từng khám phá, cùng nhau học hỏi những gì hiệu quả khi chúng ta tiến lên. Và chúng tôi đang tăng trưởng cùng bạn. Chúng tôi đang tăng trưởng cùng với khả năng AI ngày càng tăng. Và chúng tôi đang cùng nhau vượt qua những thách thức mới này.

Sự Tiến Hóa của Claude Code

Tôi vẫn nhớ một năm trước, khi tôi giao một tác vụ cho Claude Code, tôi sẽ cẩn thận đánh giá từng thay đổi mà nó cố gắng thực hiện. Từng lời nhắc cấp quyền, đưa ra phản hồi rất chi tiết về những gì tôi thích và không thích. Giống như nắm tay nó từng bước cho đến khi kết quả tốt. Tôi nhớ một số tác vụ này có thể cần 100, 200 lời nhắc cấp quyền cho đến khi tôi nhận được kết quả cuối cùng. Và bây giờ hầu hết các bạn đang chạy ở chế độ tự động. Bạn đang ủy quyền quyền hạn cho Claude. Và bạn sẽ kiểm tra sau khi Claude đã hoàn thành nhiều công việc của nó và có một PR để bạn đánh giá.

Trong năm qua, chúng tôi đã mở rộng số lượng cách bạn có thể sử dụng Claude. Chúng tôi bắt đầu với terminal, sau đó chúng tôi ra mắt IDE, và bây giờ chúng tôi có desktop. Chúng tôi bắt đầu với CLI. Đây vẫn là giao diện dành cho những người dùng chuyên nghiệp muốn một giao diện văn bản tối giản, muốn tất cả các tùy chỉnh mới nhất và kiểm soát tối đa. Sau đó, chúng tôi đã thêm IDE vì nhiều bạn thực sự muốn các tác nhân mạnh mẽ tương tự, nhưng bạn muốn theo dõi tất cả các thay đổi mã mà nó đang thực hiện. Và sau đó, dựa trên tất cả phản hồi của bạn về một cái gì đó trực quan hơn một chút, chúng tôi biết mình phải đi đâu tiếp theo. Chúng tôi đã ra mắt giao diện mới nhất của mình có tên là Claude trên Desktop. Đây là một giao diện được thiết kế cho những người muốn giao diện đồ họa toàn màn hình này, preview tích hợp để bạn có thể xem khi Claude phát triển ứng dụng của mình, một control plane sidebar cho tất cả các tác nhân của bạn và khả năng render hình ảnh và output phong phú. Chúng tôi đã xây dựng desktop để trở thành một control plane không chỉ cho các phiên cục bộ của bạn mà còn cho các phiên từ xa của bạn, với các chỉ báo trực quan cho biết tác nhân nào đang bị kẹt và tác nhân nào đã sẵn sàng hoạt động.

IDE và ứng dụng desktop được xây dựng trên Claude Agent SDK, cùng SDK mà nhiều bạn đã và đang xây dựng trên đó. Nhiều doanh nghiệp đã áp dụng các công cụ Claude Code trên toàn bộ tổ chức của họ. Và trong một lưu lượng, điều này đã thúc đẩy tăng 200% số lượng PRs trên mỗi kỹ sư, đồng thời giữ nguyên code quality bar ngay cả khi nhóm kỹ thuật của chúng tôi đã mở rộng đáng kể. Cùng với tất cả các bạn, chúng tôi đang khám phá và định nghĩa lại tương lai của kỹ thuật phần mềm sẽ như thế nào. Chúng tôi đang nắm bắt những thách thức mới này bằng cách chấp nhận automation được cung cấp bởi Claude để vượt qua từng thách thức. Tôi sẽ trình bày một vài trong số đó ngay bây giờ.

Claude Code: Giải Pháp Cho Các Vấn Đề Phát Triển Phổ Biến

Dưới đây là phản hồi mà chúng tôi nhận được từ người dùng và những gì chúng tôi đã xây dựng với sự giúp đỡ của cộng đồng này.

  • Chúng tôi nghe từ bạn rằng bạn muốn dành ít thời gian hơn cho đánh giá mã. Vì vậy, chúng tôi đã đưa ra đánh giá mã triển khai một nhóm tác nhân để phát hiện các lỗi nghiêm trọng thay mặt bạn. Hàng nghìn công ty sử dụng tính năng này mỗi ngày, bao gồm tất cả các thành viên nội bộ và thông qua nhóm của chúng tôi.
  • Chúng tôi nghe từ bạn rằng bạn thực sự muốn code on the go. Vì vậy, chúng tôi đã ra mắt remote control và chúng tôi đã thêm Claude Code vào các ứng dụng Claude trên iOSAndroid để bạn có thể bắt đầu một tác vụ từ bất cứ đâu. Bạn không còn phải đi lại với một chiếc laptop đang mở, giữ thăng bằng để không bị ngã. Và bạn không còn bị kẹt ở bàn làm việc nữa. Bây giờ bạn có thể ra công viên, touch grass, và vẫn code.
  • Chúng tôi nghe rằng bạn đang dành nhiều thời gian để "chăm sóc" các PRs, sửa lỗi flaky CI tests, giải quyết các code review comments, giải quyết tất cả các merge conflicts. Vì vậy, chúng tôi đã thêm auto-fix. Nó chỉ cần lắng nghe tất cả các sự kiện này, chủ động đưa ra các bản sửa lỗi để các PRs của bạn luôn "xanh".
  • Chúng tôi nghe từ bạn rằng bạn đang bắt đầu các tác vụ Claude Code trên các ticket mới và các báo cáo lỗi khách hàng mới. Vì vậy, chúng tôi nghĩ rằng chúng tôi nên xây dựng routines. Vì vậy, chúng tôi có routines, và nếu bạn cấu hình một lần, nó sẽ lắng nghe các webhook, API event hoặc chạy theo lịch trình. Và nó sẽ tự động bắt đầu Claude Code cho bạn. Vì vậy, thay vì bạn phải tự khởi động mọi thứ, Claude sẽ xử lý nó.
  • Và cuối cùng, chúng tôi nghe từ bạn rằng bạn đang ra mắt rất nhiều tính năng đến nỗi các security team của bạn đang gặp khó khăn trong việc theo kịp. Vì vậy, chúng tôi đã xây dựng Claude Security. Nó quét toàn bộ code base của bạn qua đêm và nó có thể bắt đầu Claude Code để giải quyết các lỗ hổng mà nó tìm thấy.

Tất cả những primitive này kết hợp với nhau. Và điều này giúp tất cả chúng ta cùng nhau thích nghi với tương lai của kỹ thuật sẽ như thế nào. Mọi thứ tôi đã đề cập là thứ bạn có thể sử dụng ngay hôm nay. Thật đặc biệt thú vị khi thấy cách một loạt các công ty đã sử dụng những công cụ này và áp dụng chúng ở quy mô toàn bộ tổ chức.

Câu Chuyện Thành Công Của Claude Code

Đầu tiên, tôi muốn chia sẻ về Shopify. Họ cung cấp e-commerce cho hàng triệu merchant trên toàn thế giới. Và họ đã thấm nhuần AI vào toàn bộ engineering org và thay đổi văn hóa của họ. Họ đang sử dụng Claude Code trên toàn công ty, cả trong các engineering team lẫn các nhóm non-engineering như design, product, data science. Họ đang xây dựng nó trực tiếp vào platform của mình và triển khai các công cụquy mô lớn. Andrew McNamara là giám đốc AI ứng dụng tại Shopify. Và theo lời của anh ấy, "tốc độ thật điên rồ". Claude Code đã biến đổi hoàn toàn cách họ xây dựng internal tools.

Một ví dụ khác là Mercado Libre. Họ là e-commerce platform phổ biến nhất của Mỹ Latinh. Họ phục vụ hơn 100 triệu người mua. Tổ chức của họ có 23.000 kỹ sư, và mọi người đều chạy trên Claude Code. Khi điều đó xảy ra trên một tổ chức, bản thân công việc thay đổi hình dạng. Các kỹ sư đang hướng tác nhân vào tech debt mà mọi người đã không động đến trong một thời gian dài và mọi người không có thời gian cho nó. Nó đã đánh giá hơn 500.000 PRs với sự giám sát của con người và hiện đại hóa hơn 9.000 ứng dụng. Oscar Mullin, người đứng đầu công nghệ, đang đặt mục tiêu đạt 90% coding tự động và một agent-driven PR loop hoàn chỉnh vào Q3 năm nay. Và chúng tôi nghe điều này từ nhiều người khác trong ngành.

Chi tiết mà tôi yêu thích nhất ở đây thực sự không phải là con số này. Không phải là nhiều managerVP mà chúng tôi nói chuyện đang bắt đầu "nhúng tay" vào code base một lần nữa. Claude Code đang đưa việc coding trở lại tay những người đã dành nhiều thập kỷ qua cho roadmapreview. Và bây giờ, họ đang quay lại xây dựng. Chúng tôi thấy điều này trên toàn ngành. Hàng triệu nhà phát triển đang ship nhiều sản phẩm hơn với chất lượng cao hơn trước đây.

Demo Claude Code: Xử Lý Hoàn Tiền và Gỡ Lỗi

Bây giờ, hãy cùng xem điều này thực sự trông như thế nào trong thực tế. Để hướng dẫn bạn, xin chào đón trưởng bộ phận Claude Code, Boris Churney. Cảm ơn, Kat. Chúng ta chụp ảnh selfie nhanh được không? Được thôi.

Trước khi tôi bắt đầu bản demo này, tôi chỉ muốn đề cập một điều. Mọi thứ chúng tôi đang trình diễn hôm nay vẫn cảm thấy kỳ diệu đối với tôi. Và tôi làm việc với Claude Code mỗi ngày. Ngay cả trong Anthropic, chúng tôi cũng chia sẻ screenshot qua lại về những điều thú vị mà mọi người đang xây dựng với Claude và những điều mọi người đang làm trong thực tế. Và thành thật mà nói, tôi chỉ cảm thấy hào hứng khi cùng nhau trên hành trình này, khám phá tất cả những điều này.

Vì vậy, hôm nay, tôi rất vui được chia sẻ thêm một vài ví dụ về những gì điều này trông như thế nào. Thật không may, không phải tất cả chúng ta đều có thể làm việc trong winner-tron business. Vì vậy, đối với bản demo này, hãy tưởng tượng chúng ta là một kỹ sư tại Acme Pay. Và đó là một công ty hạ tầng thanh toán. Chúng ta sẽ khởi động ứng dụng Claude desktop. Và chúng ta sẽ bắt đầu bằng cách thực hiện một tác vụ duy nhất. Trong phiên này, Claude đang làm việc để thêm tính năng hoàn tiền vào dashboard của merchant Acme. Nó đang xây dựng một triển khai hoàn chỉnh, tính idempotency. Vì vậy, một webhook trùng lặp sẽ không hoàn tiền gấp đôi cho một merchant. Có tính năng xử lý đa tiền tệ trên tất cả các khu vực Acme phục vụ và audit logging cho compliance team. Nó đánh giá triển khai, và nó sẽ xác minh công việc của chính mình.

Claude mở dashboard của merchant. Nó kích hoạt hoàn tiền. Và không có thông báo thành công. Đó là một trường hợp ngoại lệ/biên thực sự. Claude nhận thấy lỗi. Nó truy vết trở lại một race condition trong optimistic update. Nó sửa lỗi. Và nó sẽ xác minh rằng nó thực sự hoạt động trong trình duyệt trước khi nó đánh dấu tác vụ hoàn thành.

Quản Lý Phiên Song Song với Claude Desktop

Bây giờ, hãy phóng to ra. Phiên này không chạy một mình. Nó thực sự là một trong nhiều phiên đều đang chạy song song và được quản lý song song. Trong ứng dụng Claude desktop, bây giờ bạn có thể thấy tất cả các phiên Claude Code của mình, những phiên nào đang chạy, những phiên nào cần bạn nhập liệu, và những phiên nào có các PRs đã được hợp nhấtđóng.

Chuyển đổi sang Phát triển Async và Xác minh

Việc viết mã đồng bộ giờ đây chỉ là một phần nhỏ của những gì đang diễn ra ở bất kỳ thời điểm nào. Và chúng tôi nghĩ rằng, trong tương lai, sẽ có nhiều mã hơn được viết theo cách async. Đây là lý do tại sao chúng tôi liên tục nói về xác minh. Nếu Claude có thể tự kiểm tra công việc của mình, bạn có thể để nó chạy. Trong khi bạn làm việc khác, bạn sẽ quay lại với một kết quả hoạt động hoàn chỉnh.

Routines: Tự động hóa lời nhắc bậc cao

Đối với cá nhân tôi, ngày nay, rất nhiều mã của tôi được viết bởi các routine. Tôi không phải là người trực tiếp prompt (nhắc lệnh); tôi là người tạo ra một routine thực hiện việc prompt. Đối với các kỹ sư ở đây, hãy hình dung nó như một hàm bậc cao (higher-order function). Các routine chính là một prompt bậc cao. Ví dụ, phiên hoàn tiền mà chúng ta vừa xem. Một đồng nghiệp đã tạo một issue trên GitHub qua đêm. Một routine theo dõi repo đã nhận diện issue đó một cách async, sau đó khởi động công việc trong Claude. Với các routine, nhà phát triển có thể thiết lập các tự động hóa async và thức dậy với các PR (yêu cầu kéo) đã sẵn sàng để hợp nhất.

Đây là giao diện quản lý routine của chúng tôi. Các routine có thể chạy theo lịch trình. Chúng có thể được kích hoạt bởi các webhook hoặc thậm chí bởi các lệnh gọi API tùy ý. Bạn có thể chạy chúng cục bộ trên máy của mình, hoặc trên tài nguyên tính toán đám mây từ xa.

Tự động sửa lỗi CI và Quy trình làm việc

Hãy cùng xem một tính năng nữa. Đây là CI AutoFix mà Kat đã đề cập trước đó. Chức năng của nó là theo dõi PR mà phiên trước vừa mở. Nhiệm vụ của nó là 'chăm sóc' PR để đưa nó đến môi trường sản phẩm. Nó sẽ tự động sửa (auto-fix) bất kỳ bình luận nào từ Code ReviewSecurity Review. Nó sẽ tự động sửa CI và sẽ tự động rebase nếu có xung đột khi hợp nhất (merge conflicts).

Và hãy nhìn xem điều gì vừa xảy ra. CI đã gặp sự cố do thời gian chờ mạng (network timeout). Routine đã thức dậy, chẩn đoán đó là một vấn đề suy luận (infer issue) đã biết. Nó đã thử lại công việc và hoàn tất. Và thực ra, trong Claude Code Base, chúng tôi không chỉ cho nó thử lại; chúng tôi cho nó khắc phục nguyên nhân gốc rễ mỗi khi sự cố xảy ra. Sau đó, Shameer, người sở hữu PR đó, sẽ không bao giờ thấy một dấu X màu đỏ nữa. Và công việc đó không còn là gánh nặng của họ.

Từ khóa: Claude tự prompt Claude Code

Đó chính là sự thay đổi. Mặc định không phải là 'Tôi sẽ prompt Claude Code'. Mặc định bây giờ là 'Tôi sẽ có Claude prompt Claude Code'.

Khả năng hiện có và Lời kêu gọi hành động

Mọi thứ bạn vừa thấy đều đã có sẵn hôm nay, bao gồm các routine, các bản cập nhật mới nhất và ứng dụng Claude dành cho máy tính để bàn. Chúng tôi rất hào hứng để bạn thử nghiệm và cho chúng tôi biết suy nghĩ của bạn. Chúng tôi hy vọng những tính năng này tiếp tục rút ngắn khoảng cách giữa ý tưởng của bạn và việc phát hành sản phẩm.

Và đó thực sự là điều mà mọi bài nói chuyện hôm nay đều nhấn mạnh: đường cong khả năng của Diane, các tác nhân của Antoine Catlin tự đánh giá và cải thiện bản thân, và những gì Kat và tôi vừa trình bày. Đây là ba tầng của một câu chuyện. Các khả năng đã sẵn sàng. Khoảng cách còn lại là tốc độ chúng ta đưa chúng vào hoạt động.

Tôi khuyến khích bạn dành phần còn lại của ngày hôm nay để khám phá những tầng này: các buổi nói chuyện nghiên cứu, nếu bạn đang đánh giá các mô hình; các phiên Claude Platform, nếu bạn đang xây dựng cho người dùng của mình; hoặc các hội thảo Claude Code, nếu bạn muốn tìm hiểu thêm cách đưa Claude vào công việc phát triển hàng ngày của mình. Hãy đi sâu hơn và bắt đầu xây dựng cùng chúng tôi. Cảm ơn.

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?