Bỏ qua đến nội dung chính

Waymo's Dmitri Dolgov: 20 Million Rides and the Road to Full Autonomy

TL;DR

  • Dmitri Dolgov, đồng sáng lập Waymo, là người tiên phong trong lĩnh vực xe tự hành gần 20 năm, nổi bật với nền tảng kỹ thuật vững chắc và sự kiên trì vượt qua nhiều giai đoạn khó khăn.
  • Waymo đã phát triển từ dự án thử thách DARPA đến công ty dẫn đầu thị trường, kiên định với sứ mệnh an toàn và tin tưởng vào khả năng giải quyết vấn đề phức tạp dù trải qua nhiều chu kỳ cường điệu.
  • Công nghệ cốt lõi của Waymo dựa trên "mô hình nền tảng" đa phương thức tiên tiến, kết hợp giữa mô hình thế giới và hành động, cùng với kiến trúc end-to-end được tăng cường để đạt hiệu suất siêu phàm và khả năng mở rộng.

Điểm chính

  • Xây dựng nền tảng kỹ thuật vững chắc: Việc học hỏi sâu rộng về toán và vật lý đã trang bị cho Dmitri khả năng tự học và khám phá, là yếu tố then chốt cho sự nghiệp lâu dài trong lĩnh vực AI.
  • Tìm kiếm sứ mệnh có ý nghĩa: Khoảnh khắc "bật công tắc" đến khi tìm thấy vấn đề kết hợp sự hấp dẫn công nghệ, sứ mệnh mạnh mẽ (giảm tai nạn giao thông) và sản phẩm thực tế (xe tự hành).
  • Kiên trì qua chu kỳ cường điệu: Thành công không đến từ "viên đạn bạc" hay giải pháp dễ dàng mà từ sự hiểu biết sâu sắc về độ khó của vấn đề và niềm tin vững chắc vào sứ mệnh, đặc biệt trong các giai đoạn suy thoái.
  • Cách tiếp cận kiến trúc Waymo Driver: Hệ thống được xây dựng trên một "mô hình nền tảng" cung cấp năng lượng cho ba trụ cột: người lái (driver), trình mô phỏng (simulator) và nhà phê bình (critic), giúp hiểu vật lý, động lực và hành vi tác nhân.
  • Vượt ra ngoài end-to-end thuần túy: Trong khi end-to-end học biểu diễn phong phú, Waymo bổ sung các biểu diễn trung gian có cấu trúc để đạt được mức độ an toàn và hiệu suất siêu phàm, cần thiết cho xác thực trong thời gian chạy, huấn luyện/đánh giá vòng kín, và học tăng cường.
  • Đổi mới đồng thời phần mềm và phần cứng: Thế hệ thứ 6 của Waymo Driver không chỉ cải tiến phần mềm mà còn đơn giản hóa, giảm chi phí và cho phép sản xuất phần cứng quy mô lớn, hướng tới trải nghiệm người dùng tối ưu.
  • Mở rộng theo cấp số nhân: Quá trình mở rộng dịch vụ đang tăng tốc nhanh chóng, thể hiện sự chuyển pha trong khả năng mở rộng, từ 8 năm để có dịch vụ công cộng ở 4 thành phố đến việc ra mắt 4 thành phố mới chỉ trong một ngày.

Từ vựng

  • Autonomous Vehicle (AV) — Xe tự hành
  • Hype Cycle — Chu kỳ cường điệu
  • World Model — Mô hình thế giới
  • Foundation Model — Mô hình nền tảng
  • End-to-End — Đầu cuối đến đầu cuối (một mô hình duy nhất đi từ các cảm biến đến các hành động)
  • Software Stack — Ngăn xếp phần mềm
  • Hardware Suite / Sensor Suite — Bộ phần cứng / Bộ cảm biến
  • Reinforcement Learning (RL) — Học tăng cường
  • Multimodal World Action Language Model — Mô hình hành động ngôn ngữ thế giới đa phương thức
  • Superhuman Performance — Hiệu suất siêu phàm

Nội dung chi tiết

Giới thiệu về Dmitri Dolgov và Waymo

Chúng ta có một khách mời vô cùng đặc biệt tiếp theo: một nhà sáng lập đã và đang tác động đến rất nhiều cuộc đời và đã theo đuổi lĩnh vực này trong một thời gian rất dài. Bao nhiêu người ở đây đã từng sử dụng dịch vụ của Waymo? [tiếng cười] Thật nhẹ nhõm. "Đầu bếp tự ăn món ăn của mình." Tôi cũng vậy. Tôi dùng rất nhiều. Được rồi. Và bao nhiêu người yêu thích trải nghiệm Waymo? Tuyệt vời. Tôi hiện là người dùng hoạt động hàng ngày. Thật đáng kinh ngạc. Tuyệt vời. Cảm ơn quý vị. Chúng ta có ở đây nhà sáng lập, một người đã theo đuổi sứ mệnh này—hãy chú ý, các nhà sáng lập hoạt động trong lĩnh vực AI từ năm 2022—gần 20 năm xây dựng trong thử thách xe tự hành. Anh ấy không chỉ tham gia, mà còn theo đuổi nó qua những giai đoạn thuận lợi và khó khăn. Anh ấy đã kiên trì và tạo ra một thứ không giống bất cứ thứ gì khác trên Trái đất. Thực sự phi thường. Xin mời quý vị cùng chào đón DMITRI DOLGOV. [tiếng vỗ tay] CẢM ƠN. RẤT VUI ĐƯỢC CÓ MẶT TẠI ĐÂY. Được rồi, Dmitri, chúng ta có khoảng 25 phút để trò chuyện. Mục tiêu là để hiểu một chút về bạn, điều gì đã thúc đẩy bạn, điều gì đã giúp bạn kiên trì từ những ngày đầu của thử thách DARPA cách đây 21 năm, qua những ngày đầu của Waymo cho đến hôm nay và tương lai. Chúng ta hãy bắt đầu với câu chuyện của bạn trước, sau đó sẽ nhanh chóng đi sâu vào công nghệ. Nghe có vẻ ổn chứ? Nghe ổn. Được.

Hành trình học vấn và định hình nhân cách

Dmitri, bạn được đội ngũ của mình biết đến là người xuất sắc về mặt kỹ thuật, cực kỳ tận tâm, nhưng cũng rất tốt bụng và khiêm tốn. Bạn sinh ra ở Liên Xô, lớn lên ở Hoa Kỳ, và sau đó chọn trở lại một trong những chương trình vật lý danh giá và chuyên sâu nhất hành tinh ở Moscow. Những năm đầu đời đó đã định hình bạn và tính cách của bạn như thế nào? Cha mẹ tôi học cùng trường, vì vậy điều đó phần lớn đã thúc đẩy quyết định trở về của tôi. Tôi học trung học. Tôi thực sự đã đi đây đó khá nhiều. Tôi đã dành một năm ở Nhật Bản, sau đó học trung học ở Hoa Kỳ và trở lại đại học để học toán và vật lý ở Nga. Đó là ngôi trường mà cha mẹ tôi đã theo học, và tôi lớn lên khi nghe những câu chuyện về nơi đó. Tôi thực sự muốn trở lại. Và tôi nghĩ, về việc nó đã định hình tôi như thế nào, tôi cho rằng nó thực sự đã đặt nền tảng kỹ thuật vững chắc. Trong những ngày đầu ở đại học, một trong những điều quan trọng nhất là khả năng học hỏi và tự mình khám phá, vì vậy tôi nghĩ điều đó đã thực sự giúp ích cho sự nghiệp tương lai của tôi.

Thử thách DARPA và Bước ngoặt tự chủ

Sau chương trình rất chuyên sâu tại Viện Vật lý và Công nghệ Moscow, bạn quyết định tiếp tục con đường AI. Bạn cũng lấy bằng Tiến sĩ về AI. Và sau đó, bạn nhanh chóng bị thu hút bởi xe tự hành. Năm 2005, bạn tham gia DARPA Challenge. Bạn có thể kể về những ngày đầu đó và điều gì đã khiến bạn đến với công nghệ tự chủ không? Đối với tôi, đó là một khoảnh khắc "bật công tắc". Trong những ngày đầu khi tôi học đại học rồi sau đó là cao học, đó chủ yếu là việc học các kiến thức cơ bản và tôi hoàn toàn không có một hình dung rõ ràng về những gì tôi muốn làm sau này. Và rồi tôi nghĩ thời điểm đó thật sự may mắn đến khó tin, khi tôi đang hoàn thành chương trình cao học thì các thử thách đô thị—Grand Challenge và sau đó là Urban Challenge, thử thách mà tôi đã tham gia—đang diễn ra, và mọi thứ đã khớp lại. Công nghệ này cực kỳ thú vị. Sứ mệnh này mạnh mẽ đến mức không gì có thể sánh bằng, và đây là một sản phẩm thực tế mà bạn có thể trực tiếp trải nghiệm. Vì vậy, nó thực sự đáp ứng tất cả các tiêu chí của tôi. Và như bạn đã nói, điều này đã diễn ra cách đây hơn 20 năm rồi, và tôi chưa bao giờ hối hận; đó là những gì tôi đã làm kể từ đó.

Những năm đầu tiên của Waymo

Tuyệt vời. Waymo bắt đầu từ một dự án tại Phòng thí nghiệm ô tô Stanford. Có hai mảng trong tòa nhà này: một bên là về công nghệ tự chủ và một bên là về xe năng lượng mặt trời. Một điều thú vị là tôi là một người theo chủ nghĩa lý tưởng, tôi đã làm việc trên chiếc xe năng lượng mặt trời. Tôi đã đặt cược sai. Còn bạn thì đặt cược vào công nghệ tự chủ. Hãy kể cho chúng tôi nghe về những năm đầu tiên của Waymo từ năm 2009 đến những năm hình thành. Chúng tôi bắt đầu vào năm 2009. Vào thời điểm đó, đó là dự án xe tự lái của Google. Trong vài năm đầu tiên, tất cả chỉ là về việc tìm hiểu không gian vấn đề, hiểu được ý nghĩa của việc cố gắng đưa một chiếc xe tự hành ra đường công cộng. Vì vậy, khi bắt đầu, để đạt được những mục tiêu học hỏi và hiểu không gian vấn đề đó, chúng tôi đã đặt ra một vài mục tiêu cho mình. Một là lái tổng cộng 100.000 dặm trong chế độ tự chủ hoàn toàn, điều mà vào thời điểm đó gần như chưa từng có. Và mục tiêu thứ hai là lái 10 tuyến đường. Mỗi tuyến dài 100 dặm. Tất cả đều nằm trong Khu vực Vịnh (Bay Area), được chọn là những tuyến rất khó. Và chúng tôi phải hoàn thành mỗi tuyến từ đầu đến cuối trong chế độ tự chủ hoàn toàn. Vẫn có một người ngồi sau vô lăng có thể điều khiển, nhưng thử thách là phải hoàn thành mỗi tuyến mà không cần sự can thiệp nào. Vì vậy, đó là một nhóm nhỏ của chúng tôi, khoảng một tá người. Đó là những ngày khởi nghiệp điên cuồng ban đầu. Mọi người làm việc 24/7, viết mã và chế tạo phần cứng vào ban ngày, sau đó thử nghiệm vào ban đêm. Và chúng tôi mất khoảng 18 tháng để hoàn thành cả hai thử thách đó. Thật đáng kinh ngạc. Vào thời điểm đó, điều đó dường như là bất khả thi. Giờ đây, các bạn đã đạt được hàng trăm triệu dặm. Hoàn toàn đúng. Vậy là, những ngày đầu của Waymo đầy thách thức cực độ, và đã bắt đầu đạt được thành công.

Định hình phong cách lãnh đạo trong giai đoạn đầu của Waymo

Những năm tiếp theo, bạn có tiếng trong đội ngũ về sự làm việc cực kỳ chăm chỉ. Bạn đã ngủ lại văn phòng. Hãy kể cho chúng tôi nghe về Dmitri trong những năm đầu của Waymo và cách bạn hình thành phong cách lãnh đạo của mình. Tôi phải nói rằng những ngày đầu đó có lẽ là khoảng thời gian vui vẻ nhất mà tôi từng có trong sự nghiệp. Đó là động lực và tốc độ của những ngày đầu khởi nghiệp. Khi bạn đạt được rất nhiều tiến bộ theo từng giờ, mỗi ngày. Và bạn làm mọi thứ, đúng không? Bạn đang thiết lập phần cứng trong xe, sau đó cấu hình và hiệu chỉnh các cảm biến và hệ thống ước tính tư thế của mình. Và sau đó bạn viết phần mềm vào ban ngày, và đó là tất cả mọi thứ, đúng không? Đó là cốt lõi của phần mềm, các thuật toán điều khiển xe. Đó là tất cả các công cụ và giao diện người dùng (UI) và trải nghiệm người dùng (UX) trong xe. Vì vậy, bạn đang làm mọi thứ. Bạn học hỏi với tốc độ điên cuồng và đạt được tiến bộ với tốc độ điên cuồng. [cười khẩy] Đó là những ngày đầu của dự án Chauffeur. Và sau đó, trong vài năm đó, chúng tôi đã tự thuyết phục rằng: "Vâng, điều này đáng để theo đuổi," vì vậy chúng tôi đã tăng cường nỗ lực và thực sự bắt đầu xây dựng hướng tới tương lai của một sản phẩm tự hành hoàn toàn. Được rồi, vậy là những năm đầu tiên đầy phấn khởi, chuyên sâu, tốc độ nhanh, và kỹ thuật thực sự khó khăn.

Vượt qua chu kỳ cường điệu và suy thoái

Bây giờ, hãy đưa chúng ta đến giai đoạn 2016-2017. Đây là một giai đoạn mà chúng ta thực sự có một chu kỳ cường điệu (hype cycle) trong AI. Hóa ra đã có một vài chu kỳ như vậy. Và xe tự hành (autonomous vehicle) là trung tâm của chu kỳ cường điệu đó. Ý tôi là, tôi nhớ có rất nhiều công ty theo đuổi lĩnh vực này. Và rồi có một sự suy thoái lớn. Khi hầu hết mọi người bỏ cuộc, thất bại hoặc tan rã, các bạn đã kiên trì. Và bạn là một người lãnh đạo trong sự kiên trì đó. Đối với tất cả những nhà xây dựng trong căn phòng này, làm thế nào bạn đã vượt qua những giai đoạn khó khăn? Trước hết, một bình luận về cách các chu kỳ này nhìn nhận đối với tôi và cách tôi đã chứng kiến chúng. Và bạn nói rằng đã có nhiều chu kỳ, một số trong lĩnh vực xe tự hành nhưng rộng hơn là chung. Điều thường dẫn đến một chu kỳ như vậy là một số đột phá nhanh chóng, dẫn đến tiến bộ rất nhanh trong giai đoạn đầu của vấn đề và dòng vốn đầu tư rất nhanh vào giai đoạn đầu của vấn đề. Và đối với xe tự hành, vấn đề luôn có đặc tính này: rất dễ để bắt đầu, nhưng rất khó để đưa nó đến một sản phẩm thực sự, tự chủ hoàn toàn và hiệu suất siêu việt. Vì vậy, điều đó khá tự nhiên, với những yếu tố đó, bất cứ khi nào có một đột phá lớn trong công nghệ, dù là mạng tích chập (convolutional nets) hay transformers hay mô hình ngôn ngữ lớn (LLMs), nó đều dẫn đến chu kỳ "được rồi, bây giờ vấn đề sẽ rất dễ." Và nó định hình lại phần đầu của đường cong, nhưng nó không thay đổi phần đuôi dài của nó. Vì vậy, đối với chúng tôi, tôi nghĩ đó là sự hiểu biết rằng đây sẽ không phải là một vấn đề dễ dàng. Nhưng nó là một vấn đề rất quan trọng. Và tin tưởng vào sứ mệnh, tôi nghĩ, là rất quan trọng. Ngày nay, trên toàn thế giới, cứ 26 giây lại có người mất mạng vì tai nạn trên đường phố. Vì vậy, tôi đoán đó là sự kết hợp giữa việc biết rằng sứ mệnh thực sự, thực sự quan trọng và sau đó hiểu rõ những gì bạn phải đối mặt và không tìm kiếm những chiến thắng dễ dàng hay giải pháp nhanh chóng hoặc "viên đạn bạc" (silver bullets) giúp đội ngũ có đủ sức bền để đi đến cùng. Tuyệt vời. Vậy là các bạn đã ở trong khoảnh khắc mà việc bắt đầu thực sự dễ dàng. Rất nhiều người đã đạt được điều đó, nhưng các bạn thực sự đã kiên trì. Và đã vượt qua để đạt được một trải nghiệm thực sự kỳ diệu. Hầu hết mọi người trong căn phòng này đều giơ tay. Trải nghiệm thực sự kỳ diệu nhờ vào sự kiên trì đó.

Công nghệ hiện tại: Mô hình thế giới và Mô hình nền tảng của Waymo

Hãy nói về công nghệ ngày nay. Rất nhiều người đang nói về mô hình thế giới (world models). Các bạn đã có tất cả các thành phần của mô hình thế giới trong nhiều năm. Bạn nghĩ gì về mô hình thế giới và phiên bản mô hình thế giới của Waymo là gì? Vâng, có một vài thuật ngữ mà mọi người sử dụng ngày nay. Mọi người nói về mô hình thế giới, mô hình hành động thế giới (world action models), mô hình toàn diện (omni models), bạn biết đấy, mô hình hành động ngôn ngữ hình ảnh (visual language action models). Và ở cốt lõi của mỗi loại đó [cười khẩy] có một thành phần liên quan và thực sự quan trọng đối với Waymo và đối với những gì chúng tôi đang xây dựng trong hệ sinh thái AI của mình. Vì vậy, ở cốt lõi của hệ sinh thái AI của chúng tôi là cái mà chúng tôi gọi là mô hình nền tảng (foundation model) của Waymo, và nó cung cấp năng lượng cho ba trụ cột chính của AI và công nghệ của chúng tôi: người lái (driver), trình mô phỏng (simulator) và nhà phê bình (critic). Đó là những nhiệm vụ rất liên quan nhưng riêng biệt. Vậy, ở cốt lõi của những gì mô hình nền tảng của chúng tôi cần có khả năng là những điều như: nó cần hiểu cách thế giới hoạt động, vật lý, động lực học của thế giới vật lý. Và nó cần hiểu thế nào là một người lái tốt và [cười khẩy] tác động của các hành động của người lái đó hoặc tác nhân của chúng tôi lên các tác nhân khác trong thế giới. Và sau đó chúng tôi cần cụ thể hóa những điều đó trong tác nhân vật lý mà chúng tôi đang đưa ra đường. Vì vậy, theo một cách nào đó, mô hình nền tảng mà chúng tôi đã xây dựng trong nhiều năm là một mô hình hành động ngôn ngữ thế giới đa phương thức (multimodal world action language model). Được rồi, vậy nó là đa phương thức ở chỗ nó cần có khả năng suy luận không chỉ về hình ảnh hay video mà còn về các cảm biến khác như lidarsradars. Nó là một mô hình hành động thế giới ở chỗ nó thực sự phải có sự hiểu biết sâu sắc, chính xác về các thuộc tính không gian 3D của thế giới, động lực học, vật lý, các khía cạnh hành vi của các tác nhân khác như ô tô, người đi bộ, người đi xe đạp, v.v. Và chúng tôi không chỉ mô hình hóa thế giới một cách thụ động; chúng tôi là một người tham gia tích cực vào đó. Vì vậy, mô hình thế giới không chỉ phải có thể kiểm soát được mà chúng tôi còn cần có sự hiểu biết sâu sắc về ý nghĩa của việc trở thành một tác nhân tốt trong thế giới đó. Và cuối cùng, nó được căn chỉnh với ngôn ngữ và điều đó cho phép chúng tôi đưa kiến thức thế giới tổng quát của một VLM (Visual Language Model) vào mô hình của chúng tôi, điều này rất, rất hữu ích trong việc giúp chúng tôi tăng cường hiểu biết về ngữ nghĩa và các khía cạnh xã hội sâu sắc của việc lái xe. [cười khẩy] Và chúng tôi đã làm việc để đưa mô hình đó vào sản xuất (productionizing) trong nhiều năm và nó thực sự đòi hỏi mức độ hiệu suất, độ chính xác và tính hiện thực cực kỳ cao ở mọi khía cạnh mà chúng tôi vừa nói đến. Tuyệt vời. Vậy là, với kiến trúc người lái, trình mô phỏng, nhà phê bình này, cũng đã có rất nhiều cuộc trò chuyện về các kiến trúc end-to-end.

Mô hình End-to-End và Cách tiếp cận Nâng cao

Liệu đó có phải là sự phân đôi thích hợp? Chúng ta suy nghĩ thế nào về cách tiếp cận để đạt được hiệu suất cực cao và các phương tiện tự lái hoàn toàn có khả năng tổng quát hóa? Rõ ràng, World Model được mô tả, cụ thể là mô hình nền tảng của Waymo, là một mô hình end-to-end. Khi nói về một mô hình end-to-end, chúng ta thường hiểu đó là một mô hình duy nhất đi từ các cảm biến đến các quyết định hoặc hành động.

Một mô hình như vậy có những đặc tính rất tốt. Một trong những đặc tính quan trọng nhất là nó học được các biểu diễn phong phú, phù hợp giữa các thành phần khác nhau của hệ thống, như bộ mã hóa (encoder) và bộ giải mã (decoder), hoặc phần nhận thức (perception) và lập kế hoạch (planning) của hệ thống. Điều này khác với một giao diện được thiết kế thủ công, vốn không đủ cho một tác vụ như lái xe. Tôi cho rằng có một sự phân đôi sai lầm ở đây, rằng hoặc là end-to-end hoặc là một thứ gì đó khác. Trong tâm trí tôi, câu hỏi luôn là: "Là end-to-end và sau đó là gì nữa?" Chúng ta cần xây dựng thêm những gì nếu muốn có một sản phẩm hoàn toàn tự lái (autonomous), có mức độ an toàn siêu phàm (superhuman) và muốn triển khai nó ở quy mô lớn, vận hành hàng trăm triệu dặm đường?

Thực tế cho thấy, hệ thống end-to-end cơ bản, thuần túy là không đủ. Có một sự khác biệt lớn giữa việc sử dụng end-to-end và việc hoàn toàn dựa vào nó. Tại Waymo, chúng tôi đã thực sự vượt ra ngoài cách tiếp cận end-to-end cơ bản đó và đã tăng cường biểu diễn đã học bằng các biểu diễn trung gian có cấu trúc, được vật chất hóa. Điều này cho phép chúng tôi thực hiện một số điều rất quan trọng mà có thể không cần thiết nếu bạn đang xây dựng một sản phẩm khác, một hệ thống hỗ trợ lái (driver assist), một nguyên mẫu (prototype), một bản demo hoặc một triển khai quy mô nhỏ. Nhưng những điều này lại cực kỳ quan trọng nếu bạn muốn đạt đến một hệ thống tự lái hoàn toàn an toàn với hiệu suất siêu phàm.

Đó là những thứ như việc có thêm xác thực (validation) trong thời gian chạy (runtime) của tác nhân (agent) đang vận hành trên xe trong thế giới vật lý. Đó là những công thức (recipes) huấn luyện (training) và đánh giá (evaluation) phong phú hơn, rất khó hoặc không thực tế để thực hiện trong một hệ thống end-to-end cơ bản thuần túy. Với biểu diễn có cấu trúc được vật chất hóa này, chúng tôi nhận được sự thúc đẩy trong các lĩnh vực như đánh giá vòng kín (closed loop evaluation), huấn luyện vòng kín (closed loop training), và các hàm phần thưởng (reward functions) phong phú cho học tăng cường (reinforcement learning). Đó là cách tiếp cận của chúng tôi. Và tất cả phản hồi từ con người mà bạn nhận được từ bộ phận hỗ trợ và các tài xế tham gia, tất cả những điều đó đều rất cần thiết để có loại kiến trúc này. Chính xác. Hoàn toàn hợp lý.

Thế hệ thứ 6 của Waymo Driver và Quá trình Mở rộng

Vì vậy, bạn không chỉ đổi mới ở ngăn xếp phần mềm (software stack) mà còn ở ngăn xếp phần cứng (hardware stack). Hiện đã có thế hệ thứ sáu của Waymo driver và các bạn luôn tập trung vào vai trò người lái. Hãy kể cho chúng tôi nghe về thế hệ thứ sáu mới và cảm giác lần đầu tiên bạn tương tác với nó như thế nào?

Thế hệ thứ sáu là bộ phần cứng (hardware suite) và bộ cảm biến (sensor suite) tiên tiến nhất của chúng tôi cho đến nay. Trọng tâm của nó là hiệu suất, nhưng cũng là sự đơn giản hóa, giảm chi phí đáng kể và sản xuất hàng loạt với quy mô lớn. Đây là driver đang cung cấp năng lượng cho nền tảng phương tiện mới nhất của chúng tôi, đó là O Hi. Đầu năm nay, chúng tôi đã bắt đầu các hoạt động tự lái hoàn toàn (fully autonomous operations). Hiện tại, nó chỉ dành cho nhân viên, nhưng sẽ sớm mở cửa cho tất cả người dùng vào cuối năm nay.

Tôi đã có cơ hội trải nghiệm một chuyến đi trong một chiếc xe ngay khi chúng tôi bắt đầu các hoạt động tự lái hoàn toàn. Tôi đã dành nhiều thời gian trong đời mình trong các thế hệ xe khác nhau của chúng tôi. Thỉnh thoảng, lại có một "khoảnh khắc đầu tiên" mới và đây chắc chắn là một trong số đó. Chiếc xe tuyệt vời được thiết kế xoay quanh trải nghiệm của người ngồi trong xe. Mặc dù kích thước bên ngoài của xe tương đương với i-Pace, nhưng khi bạn bước vào, bạn có cảm giác như đang ở trong một phòng khách. Có rất nhiều không gian ở phía sau. Chúng tôi có màn hình mới. Chúng tôi có những cánh cửa trượt mở tự động khi bạn đến gần xe. Vì vậy, tôi đã có một trải nghiệm tuyệt vời và tôi nóng lòng muốn có chiếc xe này trong đội xe của chúng tôi, mở cửa cho tất cả mọi người.

Các bạn đang trải qua một giai đoạn mở rộng đáng kinh ngạc. Trong nhiều năm, chắc chắn các bạn đã ở trong phòng thí nghiệm R&D (Nghiên cứu & Phát triển). Phải mất khoảng 16 năm để đạt 100 triệu dặm, và khoảng 6 tháng để đạt 200 triệu. Mọi thứ tiếp tục mở rộng rất nhanh. Hiện có 11 thành phố, và nhiều hơn nữa đang ở phía trước. Hãy kể cho chúng tôi nghe về việc mở rộng đến một thành phố mới và sau đó là về cuộc sống hàng ngày của bạn với Waymo. Bạn sử dụng nó như một người sáng tạo như thế nào?

Có rất nhiều điều để nói. Vâng, mở rộng theo cấp số nhân (exponential scaling) là hoàn toàn đúng. Đó là một sự chuyển pha đối với chúng tôi trong cách chúng tôi mở rộng. Để cung cấp thêm một vài điểm dữ liệu, chúng tôi đã mất tám năm kể từ ngày chúng tôi bắt đầu hoạt động tự lái hoàn toàn cho đến ngày chúng tôi có dịch vụ của mình, tài xế của chúng tôi cung cấp các chuyến đi cho công chúng tại bốn thành phố. Đầu năm nay, chỉ vài tuần trước, chúng tôi đã ra mắt bốn thành phố trong một ngày. Chúng tôi đã thực hiện hơn 20 triệu chuyến đi tự lái hoàn toàn. 10 triệu trong số đó diễn ra trong bảy tháng qua. Tuyệt vời!

Đó chính là cách mở rộng theo cấp số nhân trông như thế nào. Việc ra mắt các thành phố mới bao gồm các thành phần vận hành. Bạn phải thu thập dữ liệu, đặc trưng hóa môi trường, và xác thực driver. Một phần quan trọng là bắt đầu cuộc trò chuyện với các cộng đồng địa phương vì đây là một điều mới, một sản phẩm mới. Vì vậy, trách nhiệm của chúng tôi là giành được sự tin tưởng của người dân ở đó. Và sau đó, ngày nay, chúng tôi thường thấy rằng driver đang tổng quát hóa cực kỳ tốt và đó chỉ là vấn đề đánh giá và xác thực nghiêm ngặt, độ chính xác cao trước khi chúng tôi triển khai sản phẩm tự lái hoàn toàn. Và sau đó, chúng tôi có thể phát triển từ đó.

Và phần cuối cùng của câu hỏi là gì? À, cuộc sống hàng ngày của tôi? Vâng, đó là một câu hỏi đa phần. Waymo là cách tôi di chuyển ngày nay. Đó là cách tôi đến đây hôm nay. Đó là một chuyến đi tuyệt vời từ Palo Alto lên San Francisco trên đường cao tốc. Gia đình tôi sử dụng nó. Tôi có ba đứa con. Chúng rất thích Waymo. Tôi nghĩ ngày nay chúng sẽ khó chịu nếu trong một trường hợp hiếm hoi chúng tôi phải ở trong một chiếc xe do tôi hoặc vợ tôi hoặc một người nào đó lái. Chúng sẽ nói: "Ồ, có chuyện gì đang xảy ra vậy?"

Chúng rất thích nó. Nó đã là một phần cuộc sống của chúng. Khi chúng tôi lái xe, có hai thứ, chỉ có hai thứ khiến con tôi thích thú ngày nay. Đó là những chú chó và Waymo.

Văn hóa An toàn và Hiệu suất Vượt trội

Vậy, hãy nói về an toàn. Một trong những phần ý nghĩa và thú vị nhất khi hợp tác với Waymo là thực tế có 1.19 triệu người chết mỗi năm trên Trái đất vì tai nạn giao thông đường bộ. Đây là vấn đề sinh tử. Nó không chỉ chạm đến mọi người trong căn phòng này, mà mọi người đều có một mối liên hệ nào đó với những người đã bị ảnh hưởng bởi điều này. Các bạn đã tập trung vào an toàn ngay từ đầu. Và điều đó thực sự khó khăn, bạn biết đấy, ở Thung lũng Silicon nơi mọi người theo triết lý "di chuyển nhanh và phá vỡ mọi thứ rồi xem điều gì xảy ra", các bạn đã vô cùng kiên nhẫn với an toàn. Bạn có thể kể cho chúng tôi nghe một câu chuyện khiến điều đó trở nên rất thực tế đối với bạn và làm thế nào bạn duy trì văn hóa an toàn đó tại Waymo?

Những con số bạn vừa đề cập, đó là động lực thúc đẩy tất cả chúng tôi tại Waymo và hiện trạng này không thể chấp nhận được. Chúng tôi đã dần dần chấp nhận điều này theo thời gian, nhưng việc thách thức hiện trạng thực sự quan trọng đối với mọi người trong công ty chúng tôi. Bạn hoàn toàn đúng khi nói rằng cách bạn xây dựng một hệ thống như thế này khác với những gì bạn có thể làm ở các lĩnh vực, ngành nghề khác, nơi an toàn phải là nền tảng không thể thương lượng và bạn phải xây dựng nó vào mọi thứ bạn làm ngay từ ngày đầu tiên. Kiến trúc mô hình (model architecture), công thức huấn luyện và đánh giá (training and evaluation recipe), đó là tư duy của cả nhóm.

Có thể rất hấp dẫn khi chỉ tập trung vào khả năng trước và đạt được 90% rất nhanh, nhưng cách bạn đạt được 90% đầu tiên hoàn toàn khác với cách bạn đạt được các mức độ chính xác cao hơn. Vì vậy, việc ghi nhớ điều đó và tập trung vào an toàn như một lớp nền tảng không thể thương lượng ngay từ ngày đầu tiên là cực kỳ quan trọng.

Hiện tại, chúng tôi đang lái hơn 4 triệu dặm đường tự lái hoàn toàn mỗi tuần. Và bạn thấy rất nhiều sự kiện từ thực tế và ngày nay chúng tôi có dữ liệu từ hơn 170 triệu dặm tự lái hoàn toàn, nơi chúng tôi thấy rằng Waymo driver an toàn hơn 13 lần so với tài xế con người khi nói đến các vụ va chạm gây thương tích nghiêm trọng ở các thành phố chúng tôi hoạt động. Và bạn thấy hành vi an toàn siêu phàm đó biểu hiện trên đường hàng ngày. Tôi thấy các ví dụ như gần đây có một trường hợp mà tôi thấy về một người, tôi nghĩ đó là một phụ nữ trẻ đi xe scooter điện trên đường, sau đó cô ấy mất kiểm soát và bị ngã ngay trước Waymo. Waymo driver đã thể hiện độ chính xác và thời gian phản ứng siêu phàm, có thể đánh lái và phanh lại, và mọi người đều an toàn.

Những điều như thế này mà cá nhân tôi và toàn bộ đội ngũ thấy rất bổ ích về việc thực sự có tác động đến sự an toàn trên đường của chúng ta. Và ở quy mô chúng tôi đang hoạt động, việc giảm 13 lần đó có nghĩa là chúng tôi đang ngăn chặn một vụ thương tích nghiêm trọng cứ mỗi 8 ngày. Và tác động đó sẽ chỉ tăng lên khi chúng tôi mở rộng quy mô.

Tuyệt vời. Chúng ta sẽ mở phần hỏi đáp cho khán giả trong vài phút nữa. Trước khi chúng ta bắt đầu, tôi đã nghe một câu chuyện về việc Lidar hoặc Radar phát hiện tiếng bước chân của ai đó phía sau một chiếc xe buýt. Điều đó có xảy ra không và nó hoạt động như thế nào?

Vâng, vâng, đó là một trong những khoảnh khắc mà tôi đã thực sự ngạc nhiên trước khả năng tự phát sinh (emerging capability) của hệ thống chúng tôi. Tình huống đó là ở San Francisco. Waymo driver đang ở một giao lộ. Có một chiếc xe buýt băng qua và chúng tôi đang chờ ở đèn đỏ. Sau đó, chiếc xe buýt đã băng qua và dừng lại, một phần chắn ngang giao lộ. Đèn của chúng tôi chuyển sang màu xanh. Waymo driver bắt đầu di chuyển và khi đang di chuyển, nó phát hiện một người đi bộ ở phía bên kia xe buýt. Và bạn biết đấy, bạn không thể nhìn xuyên qua xe buýt. Không phải qua Lidar, không phải Radar, không phải Camera, cửa sổ phản chiếu những người bên trong xe buýt. Và sau đó, xe bắt đầu phản ứng phòng thủ và chắc chắn, một người đi bộ xuất hiện từ phía sau xe buýt và sau đó chúng tôi có thể nhẹ nhàng vượt qua họ và mọi người đều tiếp tục đi.

Khi tôi thấy điều đó, tôi đã rất kinh ngạc. Tôi không chắc điều gì đang xảy ra. Tôi đoán rằng dù Waymo driver có khả năng siêu phàm đến đâu, nó cũng không thể nhìn xuyên qua các vật thể rắn. Vì vậy, thực ra điều đã xảy ra là Lidar của chúng tôi đã phản xạ tín hiệu dưới gầm xe buýt và nhận được một tín hiệu phản hồi rời rạc từ chuyển động của bàn chân người dưới gầm xe buýt và điều đó đủ để AI của Waymo không chỉ phát hiện ra có một người đi bộ ở đó, mà còn đưa ra dự đoán về những gì sẽ xảy ra trong tương lai và giữ an toàn cho mọi người. Thật kinh ngạc. Khá là khó tin. Chúng ta còn thời gian cho một câu hỏi từ nhóm.

Tầm nhìn 5-10 năm và Kế hoạch Mở rộng của Waymo

Nếu có ai có chìa khóa, Jim, xin lỗi, không có mã miễn phí. Không phải ở đây. Không. Vâng, Jim, xin mời. Cảm ơn. Cái này hoạt động không? Có. Tôi chỉ muốn nói lời chúc mừng về tất cả những gì bạn đã đạt được. Thật sự đáng kinh ngạc. Nếu bạn nghĩ về 5 đến 10 năm tới, hãy tập trung vào mô hình kinh doanh, các cột mốc quan trọng là gì, điều gì sẽ xảy ra ở các thành phố lớn, điều gì sẽ khác so với hiện tại của chúng ta? Hãy nói cho chúng tôi nghe về tầm nhìn của bạn về tương lai.

Chúng tôi đang dồn sức vào chế độ triển khai. [tiếng khịt mũi] Chúng tôi đã chuyển từ việc giảm thiểu rủi ro tuần tự có chủ đích đối với người lái và các bộ phận quan trọng của doanh nghiệp sang việc thương mại hóa toàn cầu nhanh chóng, song song. Điều đó có nghĩa là triển khai Waymo driver ở nhiều nơi hơn trên khắp Hoa Kỳ. Hôm nay, chúng tôi có mặt tại 11 thành phố, vận hành hoàn toàn tự động và phục vụ hành khách của chúng tôi. Chúng tôi sẽ mở rộng tại những địa điểm hiện có. Chúng tôi sẽ thêm các khu vực địa lý mới, các thành phố mới. Chúng tôi cũng đang mở rộng ra quốc tế. Chúng tôi đã thông báo rằng năm nay chúng tôi sẽ lên kế hoạch cung cấp dịch vụ tại London và Tokyo. Vì vậy, bạn sẽ thấy chúng tôi tăng tốc triển khai đó, tất cả đều phục vụ sứ mệnh của chúng tôi. Một tin tốt cho đội ngũ của chúng tôi ở London.

Tổng kết và Lời cảm ơn

Chúng ta đã nói về rất nhiều điều, Dmitri, từ những ngày đầu khi bạn có thể đi được quãng đường dài mà không cần nhiều công nghệ, cho đến việc kiên trì vượt qua những thời điểm cực kỳ khó khăn trong lĩnh vực xe tự lái và đạt được thành công đó. Chúng ta đã nói về mô hình thế giới, kiến trúc trình mô phỏng người lái và phản biện. Chúng ta đã đi sâu vào phần cứng, phần cứng thế hệ thứ sáu, an toàn và mở rộng quy mô.

Nhưng trên hết, tôi hy vọng rằng chúng ta đã hiểu thêm một chút về Dmitri, người đàn ông đã mang đến phép màu Waymo cho rất nhiều người trong chúng ta. Và khi tôi ngày càng hiểu bạn hơn, tôi không ngừng bị ấn tượng không chỉ bởi sự xuất chúng, sự kiên trì và hiệu suất của bạn, mà còn bởi sự khiêm tốn của bạn. Điều đó nói lên rất nhiều về việc hoàn thành một khối lượng công việc lớn như vậy. Cảm ơn Dmitri. Xin hãy cùng tôi cảm ơn Dmitri vì tất cả những gì anh ấy đã làm. Cảm ơn [tiếng vỗ tay]. Cảm ơn. Cảm ơn. Và rất nhiều mạng sống đã được cứu. Cảm ơn.

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?