Xem nhanh
Gemini được xây dựng từ đầu với tính đa phương thức, nghĩa là nó có thể khái quát hóa, hiểu, vận hành và kết hợp liền mạch các loại thông tin khác nhau, bao gồm văn bản, mã, âm thanh, hình ảnh và video, giống như cách con người nhìn, nghe, đọc, lắng nghe và nói chuyện về nhiều loại thông tin cùng lúc.
Trong năm 2023, chúng tôi đã giới thiệu nhiều cải tiến lớn về AI cho nhóm khách hàng doanh nghiệp và nhóm cộng đồng các nhà phát triển ứng dụng và người dùng mở rộng, bao gồm: Siêu máy tính AI để huấn luyện và phục vụ các mô hình generative AI (trí tuệ nhân tạo tạo sinh); Hỗ trợ AI tạo sinh trên Vertex AI – nền tảng AI Doanh Nghiệp của Google Cloud Duet AI trong Google Workspace; và Duet AI cho Google Cloud.
Cơ sở hạ tầng AI của chúng tôi đã được trang bị thêm nhiều khả năng xử lý mới với những cải tiến đáng kể trong GPU, TPU, phần mềm và trình biên dịch ML, khả năng quản lý khối lượng công việc và nhiều hơn nữa; nhiều sáng tạo mới trong Vertex AI; và một bộ khả năng xử lý hoàn toàn mới với các agent Duet AI trong Google Workspace và Google Cloud Platform.”
Chúng tôi đã ghi nhận sự tăng trưởng đáng kể về số lượng nhà phát triển ứng dụng và người dùng. Ví dụ, từ quý II đến quý III năm nay, số lượng dự án generative AI đang hoạt động trên Vertex AI đã tăng hơn 7 lần. Các thương hiệu hàng đầu như Forbes, Formula E và Spotify đang sử dụng Vertex AI để xây dựng các agent riêng, còn Anthropic, AI21 Labs và Cohere đang tự huấn luyện các mô hình riêng của họ.
Phạm vi và tính sáng tạo của các ứng dụng mà khách hàng của chúng tôi đang phát triển thật đáng kinh ngạc. Fox Sports đang tạo ra nội dung hấp dẫn hơn. Priceline đang xây dựng một ứng dụng hướng dẫn viên du lịch kỹ thuật số. Six Flags đang tạo ra hướng dẫn viên kỹ thuật số cho các khu vui chơi. Và Estée Lauder đang xây dựng một nhà quản lý thương hiệu kỹ thuật số.
Hôm nay, chúng tôi xin giới thiệu một loạt các khả năng xử lý mới quan trọng trên nền tảng AI của mình, hỗ trợ cho Gemini – mô hình đa năng và mạnh mẽ nhất hiện nay. Gemini được xây dựng từ đầu với tính đa phương thức, nghĩa là nó có thể khái quát hóa, hiểu, vận hành và kết hợp liền mạch các loại thông tin khác nhau, bao gồm văn bản, mã, âm thanh, hình ảnh và video, giống như cách con người nhìn, nghe, đọc, lắng nghe và nói chuyện về nhiều loại thông tin cùng lúc.
Kiến trúc AI thống nhất của Google Cloud
Bắt đầu từ hôm nay, Gemini là một phần của bộ công nghệ AI tích hợp và tối ưu theo chiều dọc, bao gồm các thành phần quan trọng đã được thiết kế để phối hợp nhịp nhàng với nhau:
- Cơ sở hạ tầng AI siêu mở rộng: Google Cloud cung cấp cơ sở hạ tầng AI tối ưu hàng đầu cho các doanh nghiệp, tương tự như những gì Google đang sử dụng để huấn luyện và phục vụ các mô hình AI. Chúng tôi cung cấp cơ sở hạ tầng này dưới dạng dịch vụ trong các khu vực hạ tầng đám mây sẵn có, giúp bạn có thể hoạt động trong trung tâm dữ liệu của mình với Google Distributed Cloud và thậm chí trên cả mạng rìa (Edge). Toàn bộ hệ thống cơ sở hạ tầng AI của chúng tôi được xây dựng với thiết kế mã nguồn cấp hệ thống nhằm tăng hiệu quả và năng suất cho các hoạt động huấn luyện, tinh chỉnh và phục vụ AI.
- Mô hình đẳng cấp thế giới: Chúng tôi liên tục cung cấp một loạt các mô hình AI với các kỹ năng khác nhau. Vào cuối năm 2022, chúng tôi đã ra mắt Mô hình Ngôn ngữ Pathways (PaLM), sau đó là PaLM 2, và hiện tại chúng tôi đang cung cấp Gemini Pro. Chúng tôi cũng đã giới thiệu các mô hình chuyên biệt cho từng lĩnh vực như Med-PaLM và Sec-PaLM.
- Vertex AI – Nền tảng AI doanh nghiệp hàng đầu cho nhà phát triển: Chúng tôi đã nhanh chóng cải tiến nền tảng phát triển AI của Google – Vertex AI, để hỗ trợ nhà phát triển xây dựng các agent và tích hợp generative AI vào các ứng dụng của họ. Vertex AI giúp khám phá, tùy chỉnh, tăng cường, triển khai và quản lý các agent được xây dựng bằng API Gemini, đồng thời cung cấp một danh sách hơn 130 mô hình AI mã nguồn mở và của bên thứ ba đã được tuyển chọn kỹ lưỡng, đáp ứng các tiêu chuẩn nghiêm ngặt về an toàn và chất lượng doanh nghiệp của Google. Vertex AI tận dụng các biện pháp kiểm soát quyền riêng tư và quản trị dữ liệu tích hợp của Google Cloud, đồng thời cung cấp công cụ giúp các nhà phát triển sử dụng các mô hình một cách có trách nhiệm và an toàn. Bên cạnh đó, Vertex AI còn cung cấp tính năng Tìm kiếm (Search) và Hội thoại (Conversation) – những công cụ sử dụng phương pháp mã hóa ít phức tạp để phát triển các chức năng tìm kiếm tinh vi và các agent đàm thoại có thể hoạt động trên nhiều kênh giao tiếp.
- Duet AI – Trợ lý AI thông minh cho Google Workspace và Google Cloud: Duet AI là cộng tác viên AI hỗ trợ người dùng khi họ sử dụng Google Workspace và Google Cloud. Ví dụ: Duet AI trong Google Workspace giúp người dùng viết, tạo hình ảnh, phân tích bảng tính, soạn thảo và tóm tắt email hoặc các các tin nhắn trò chuyện, tóm tắt các cuộc họp. Duet AI trong Google Cloud thì có thể giúp người dùng viết mã, triển khai, mở rộng quy mô và giám sát các ứng dụng cũng như xác định và đẩy nhanh quá trình giải quyết các mối đe dọa an ninh mạng.
Củng cố cơ sở hạ tầng đẳng cấp thế giới
Cùng với sự gia tăng về kích thước và độ phức tạp của các mô hình generative AI, các yêu cầu về huấn luyện, tinh chỉnh và suy luận của chúng cũng ngày càng phức tạp. Kết quả là, nhu cầu đối với cơ sở hạ tầng AI hiệu suất cao, khả năng mở rộng mạnh mẽ và tiết kiệm chi phí cho việc huấn luyện và phục vụ các mô hình đang tăng theo cấp số nhân.
Điều này không chỉ đúng với khách hàng của chúng tôi, mà còn đúng với bản thân Google. Các TPU từ lâu đã trở thành nền tảng cho việc huấn luyện và phục vụ các sản phẩm hỗ trợ AI như YouTube, Gmail, Google Maps, Google Play và Android. Thực tế là, Gemini đã được phát triển và vận hành nhờ vào sức mạnh của các TPU.
Tuần trước, chúng tôi đã ra mắt Cloud TPU v5p – bộ gia tốc phần cứng AI mạnh mẽ, linh hoạt và có khả năng mở rộng nhất từ trước đến nay. TPU v5p cung cấp khả năng mở rộng gấp 4 lần so với TPU v4 về tổng số FLOPs có thể vận hành trên từng cụm. Đầu năm nay, Google Cloud cũng đã công bố phiên bản Cloud TPU v5e với khả năng cải thiện hiệu suất suy-luận-trên-giá gấp 2,7 lần so với thế hệ trước đó là TPU v4, đây cũng là TPU tiết kiệm chi phí nhất của chúng tôi cho đến nay.
Ngoài ra, chúng tôi cũng đã công bố AI Hypercomputer, một kiến trúc siêu máy đột phá kết hợp hệ thống tích hợp bao gồm phần cứng tối ưu hiệu suất, phần mềm mở, khung ML hàng đầu và các mô hình tiêu thụ linh hoạt. AI Hypercomputer sở hữu nhiều tùy chọn bộ gia tốc, bao gồm các lớp TPU thế hệ thứ 5 khác nhau và các GPU NVIDIA.
Cung cấp những mô hình đột phá mới nhất của Google Cloud
Cho đến nay, Gemini cũng là mô hình AI linh hoạt nhất của chúng tôi, nó có thể hoạt động hiệu quả trên mọi nền tảng, từ trung tâm dữ liệu cho đến thiết bị di động.
Gemini Ultra là mô hình lớn nhất và mạnh mẽ nhất dành cho các tác vụ phức tạp, trong khi Gemini Pro là lựa chọn tối ưu để mở rộng quy mô trên nhiều loại tác vụ khác nhau. Còn Gemini Nano là mô hình hiệu quả nhất dành cho các tác vụ thực hiện trên thiết bị di động. Việc xây dựng và mở rộng quy mô AI của các doanh nghiệp và nhà phát triển sẽ được cải thiện đáng kể với những khả năng xử lý tối tân của Gemini.
Hôm nay, chúng tôi cũng đã giới thiệu Imagen 2 – phiên bản nâng cấp của mô hình hình ảnh Imagen, với công nghệ chuyển đổi văn bản thành hình ảnh tiên tiến nhất. Phiên bản mới nhất này đã cải thiện tính năng chụp ảnh chân thực, hiển thị văn bản và tạo logo để bạn có thể dễ dàng tạo hình ảnh với lớp phủ văn bản và tạo logo.
Ngoài ra, dựa trên những nỗ lực với Med-PaLM nhằm phát triển các mô hình AI chuyên biệt theo lĩnh vực, chúng tôi rất vui mừng được giới thiệu MedLM, dòng mô hình nền tảng được tinh chỉnh cho các trường hợp sử dụng trong ngành sức khỏe. MedLM hiện đã có sẵn cho khách hàng trong danh sách cho phép của chúng tôi trên Vertex AI, mang đến cho khách hàng sức mạnh của các mô hình nền tảng Google được tinh chỉnh với chuyên môn y tế.
Nâng cao hiệu suất nền tảng Vertex AI với Gemini
Hôm nay, chúng tôi xin được thông báo rằng Gemini Pro hiện đã có bản xem trước trên Vertex AI. Bằng công cụ này, các nhà phát triển có thể xây dựng các agent mới và khác biệt để có thể xử lý thông tin từ văn bản, code, hình ảnh và video. Vertex AI hỗ trợ triển khai và quản lý các agent trong thực tế vận hành ứng dụng, đánh giá tự động chất lượng và độ tin cậy của phản hồi từ agent, đồng thời giám sát và quản lý chúng.
Vertex AI cung cấp sự hỗ trợ toàn diện cho Gemini, với khả năng khám phá, tùy chỉnh, tăng cường, quản lý và triển khai các agent được xây dựng dựa trên API Gemini, bao gồm:
- Nhiều cách để tùy chỉnh các agent được xây dựng với Gemini bằng cách sử dụng dữ liệu của riêng bạn, bao gồm kỹ thuật thiết kế nhắc (prompt engineering), tinh chỉnh dựa trên bộ điều hợp như Low-Rank Adaptation (LoRA), học tăng cường từ phản hồi của con người (RLHF) và chưng cất (distillation).
- Các công cụ tăng cường cho phép các agent sử dụng phần nhúng (embedding) để truy xuất, hiểu và hành động dựa trên thông tin thực, cấu thành bằng mô hình sinh văn tăng cường truy hồi (RAG) có thể tùy chỉnh. Vertex AI cũng cung cấp các tiện ích mở rộng để hành động thay người dùng trong các ứng dụng bên thứ ba.
- Cải thiện chất lượng phản hồi của Gemini và các mô hình AI khác bằng cách đối chiếu kết quả với nguồn dữ liệu web và doanh nghiệp chất lượng cao..
- Một bộ công cụ kiểm soát toàn diện giúp sử dụng các mô hình AI tạo sinh, bao gồm Gemini, một cách an toàn và có trách nhiệm.
Bên cạnh hỗ trợ Gemini trong Vertex AI, hôm nay chúng tôi cũng công bố về:
- Automatic Side by Side (Auto SxS) – công cụ tự động so sánh các mô hình AI. Auto SxS nhanh hơn và tiết kiệm chi phí hơn so với việc đánh giá mô hình theo cách thủ công, đồng thời có thể tùy chỉnh thông số của các tác vụ khác nhau để giải quyết các trường hợp sử dụng AI tạo sinh mới.
- Bổ sung Model Garden của Vertex AI với Mistral, ImageBind và DITO, tiếp nối cam kết của chúng tôi về một hệ sinh thái mô hình mở.
- Sắp tới, chúng tôi sẽ sớm tích hợp Gemini Pro vào Tìm kiếm và Trò chuyện của Vertex AI để giúp bạn nhanh chóng xây dựng các ứng dụng hấp dẫn, sẵn sàng đưa vào vận hành.
Mở rộng khả năng của Duet AI
Với Duet AI, chúng tôi cam kết giúp khách hàng tăng năng suất, đạt được lợi thế cạnh tranh và sau cùng là cải thiện lợi nhuận của họ. Hiện nay, Duet AI dành cho Nhà phát triển (Duet AI for Developers) và Duet AI trong Hoạt động bảo mật (Duet AI for Security Operations) đã sẵn sàng và chúng tôi sẽ kết hợp Gemini vào danh mục Duet AI của mình trong vài tuần tới.
Duet AI for Developers giúp người dùng viết code nhanh hơn với khả năng hoàn thiện code AI, tạo code và trò chuyện trong nhiều môi trường phát triển tích hợp (IDE). Nó giúp tổ chức các tác vụ và quy trình lặp đi lặp lại của nhà phát triển bằng các phím tắt cho các tác vụ phổ biến, bao gồm tạo kiểm tra unit (đơn vị) và giải thích code, tăng tốc độ khắc phục sự cố và xử lý sự cố, đồng thời giúp giảm chuyển đổi ngữ cảnh. Duet AI cũng đẩy nhanh việc học kỹ năng bằng cách cho phép người dùng đặt câu hỏi một cách tự nhiên.
Hôm nay, chúng tôi cũng thông báo rằng hơn 25 đối tác hỗ trợ code và kiến thức nền sẽ đóng góp các bộ dữ liệu chuyên biệt cho nền tảng họ. Nhờ đó, người dùng Duet AI for Developers có thể được hỗ trợ AI dựa trên code và mô hình dữ liệu từ những đối tác này, kể cả tài liệu sản phẩm, những ứng dụng tốt nhất và các tài nguyên doanh nghiệp hữu ích khác của họ.
Duet AI in Security Operations – nền tảng bảo mật tích hợp của Google Cloud, có thể giúp các chuyên gia bảo vệ tổ chức của họ hiệu quả hơn khỏi các cuộc tấn công mạng. Các đội an ninh có thể nâng cao kỹ năng của họ và đẩy nhanh tốc độ phát hiện, điều tra và ứng phó mối đe dọa bằng cách sử dụng sức mạnh của AI tạo sinh.
Với Duet AI in Security Operations, chúng tôi sẽ cung cấp hỗ trợ AI đầu tiên trong Chronicle, nơi người dùng có thể tìm kiếm lượng dữ liệu khổng lồ trong vài giây với các truy vấn tùy chỉnh được tạo từ ngôn ngữ tự nhiên, giảm thiểu việc kiểm tra thủ công kéo dài, nhanh chóng xử lý bối cảnh quan trọng bằng cách tận dụng các bản tóm tắt tự động của dữ liệu trường hợp và cảnh báo, đồng thời cải thiện thời gian phản hồi qua việc sử dụng các đề xuất cho các bước tiếp theo để hỗ trợ khắc phục sự cố.
Google sở hữu toàn bộ hệ thống công nghệ Duet AI, từ cơ sở hạ tầng và mô hình nền tảng cho đến trải nghiệm người dùng và tích hợp cấp cao. Chúng tôi tự hào rằng các kỹ sư và nhà nghiên cứu của chúng tôi đã hợp tác chặt chẽ để mang đến cho khách hàng những đột phá về công nghệ AI mới nhất với trải nghiệm sản phẩm thống nhất, nhất quán. Đầu năm tới, chúng tôi dự định mở rộng Duet AI trên danh mục sản phẩm, bao gồm Duet AI trong BigQuery, Looker, các sản phẩm cơ sở dữ liệu, Apigee và hơn thế nữa.
Thúc đẩy các giải pháp AI thế hệ tiếp theo
Bên cạnh những tính năng mới trên hệ thống công nghệ AI được tích hợp theo chiều dọc, chúng tôi còn có mức giá cạnh tranh, giúp Gemini tiếp cận đến nhiều tổ chức hơn, cũng như mở rộng phạm vi bồi thường để bảo vệ bạn khỏi các vấn đề về bản quyền.
Bên cạnh danh mục cơ sở hạ tầng AI mở rộng của chúng tôi cùng Vertex AI và Duet AI, việc ra mắt Gemini đã mang đến một giải pháp điện toán đám mây toàn diện và mạnh mẽ cho các nhà phát triển và khách hàng. Với những cải tiến này, Google Cloud đang thúc đẩy các agent thế hệ tiếp theo được hỗ trợ bởi AI trong mọi ngành, hỗ trợ các tổ chức xây dựng, sử dụng và áp dụng thành công AI tạo sinh để thúc đẩy quá trình chuyển đổi kỹ thuật số của họ.
Tác giả: Thomas Kurian – CEO Google Cloud.