#googlelaunchesgemini3.5flash

Gemini 3.5 và Android Halo đang định hình tương lai của trí tuệ nhân tạo

Chúng ta sẽ đi sâu vào gia đình Gemini 3.5, bao gồm Gemini Omni cách mạng, các tác nhân tìm kiếm tự động mới, Android Halo và tất cả những đổi mới Workspace nâng cao năng suất tại sự kiện Google I/O 2026.

Google, trong khuôn khổ hội nghị nhà phát triển được mong chờ hàng năm Google I/O 2026, đang mở ra cánh cửa cho một kỷ nguyên mới trong thế giới công nghệ. Tại sự kiện năm nay, chúng ta thấy các mô hình trí tuệ nhân tạo không chỉ là công cụ trả lời các lệnh mà còn trở thành các tác nhân thông minh có khả năng đưa ra quyết định chủ động và quản lý các quy trình công việc phức tạp.

Google chính thức công bố gia đình Gemini 3.5 thế hệ mới, mô hình Gemini Omni có khả năng xử lý đồng thời mọi loại đầu vào và các khả năng tự động hóa hoàn toàn thay đổi toàn bộ hệ sinh thái từ Google Tìm kiếm đến hệ điều hành Android.

Gemini 3.5 và Gemini Omni được Công bố: Gia đình Gemini 3.5 thực hiện các quy trình công việc nhiều bước và mô hình Gemini Omni cách mạng có khả năng xử lý đồng thời văn bản, âm thanh, hình ảnh và video được giới thiệu đến người dùng.

Quá trình Tìm kiếm và Mua sắm trở nên Tự động: Google Tìm kiếm đã phát triển tính năng “Ajan Tìm kiếm” có khả năng lập kế hoạch du lịch và nghiên cứu sâu vượt ra ngoài việc chỉ liệt kê các liên kết; hệ thống “Giỏ hàng Toàn cầu” khởi đầu kỷ nguyên mua sắm tự động giữa các trang web.

Trợ giúp Liên tục với Gemini Spark và Android Halo: Trải nghiệm trợ lý kỹ thuật số hoàn toàn tự do nhờ Ajan cá nhân Gemini Spark chạy 24/7 và giao diện Android Halo được tích hợp vào màn hình khóa và màn hình chính của Android.

Gemini 3.5 đã mang đến một kỷ nguyên mới trong lĩnh vực trí tuệ nhân tạo với Gemini Omni.

Gia đình mô hình thế hệ mới được phát triển dưới sự lãnh đạo của CTO Google DeepMind Koray Kavukcuoğlu và Nhà khoa học chính của Google Jeff Dean, được xây dựng từ đầu để thực hiện các lịch trình chủ động. Gia đình mới này bao gồm ba phân khúc chính: Gemini 3.5 Flash, Gemini 3.5 Pro và Gemini 3.5 Ultra.

Quản lý Quy trình Công việc bằng Gemini 3.5 Flash

Gemini 3.5 Flash được tối ưu hóa cho các nhiệm vụ chủ động quy mô lớn yêu cầu tốc độ và hiệu suất cao, có khả năng thực hiện các nghiên cứu dữ liệu, tích hợp và báo cáo trước đây mất hàng giờ chỉ trong vài phút.

Mô hình này, có khả năng phân tích các bảng tài chính phức tạp, loại bỏ các lỗi trong mã nguồn một cách chủ động và thực hiện các hoạt động nhiều bước, từ hôm nay sẽ trở thành mô hình mặc định cho các người dùng Gemini Advanced trên toàn cầu.

Mô hình cũng ngay lập tức ngăn chặn các rủi ro tiềm tàng và nội dung gây hiểu lầm nhờ vào kiến trúc bảo mật Frontier Safeguards tích hợp sẵn.

Cách mạng Đa phương thức: Gemini Omni

Một trong những thông báo nổi bật nhất của sự kiện là Gemini Omni, với khả năng xử lý đồng thời mọi loại dữ liệu như video, văn bản, âm thanh và hình ảnh, từ đó tạo ra đầu ra. Người dùng có thể truyền đạt những ý tưởng phức tạp chỉ bằng cách nói hoặc cho AI xem một video.

Từ tuần này, các tính năng nổi bật của Gemini Omni sẽ được cung cấp cho người đăng ký Google AI Pro và Ultra.

Biến đổi thế giới: Cho phép thay đổi, phong cách hóa và phân tích các đối tượng, trang phục hoặc không gian xung quanh ngay lập tức qua camera.

Tưởng tượng lại các Hành động: Thiết kế lại các chuyển động của các nhân vật hoặc bối cảnh trong một video ngắn bằng các lệnh ngôn ngữ tự nhiên.

Tạo Avatar Kỹ thuật số: Cho phép người dùng tạo ra các avatar kỹ thuật số tự nhiên chất lượng cao, nói bằng giọng nói và hình ảnh của chính họ, giúp chuẩn bị các bài thuyết trình hoặc nội dung.

Google Tìm kiếm và Mua sắm được Đổi mới Từ Đầu đến Cuối

Google Tìm kiếm, từ khi thành lập đã trải qua sự chuyển mình lớn nhất với tính năng Ajan Tìm kiếm (Search Agents) sẽ thay đổi thói quen người dùng một cách triệt để. Công cụ tìm kiếm được hỗ trợ bởi sự tích hợp Gemini 3.5 Flash giờ đây không chỉ liệt kê các liên kết mà còn lập kế hoạch cho các yêu cầu phức tạp từ đầu đến cuối.

Lập kế hoạch Từ Đầu đến Cuối với Ajan Tìm kiếm

Các Ajan Tìm kiếm cung cấp cho người dùng khả năng lập kế hoạch nâng cao, nghiên cứu sâu và mua sắm thông minh. Ví dụ, khi được yêu cầu, “Hãy chuẩn bị cho tôi một kế hoạch nghỉ dưỡng ba ngày ở Denizli với ngân sách hợp lý, bao gồm các địa điểm lịch sử và thân thiện với trẻ em”, hệ thống sẽ tạo ra một chương trình du lịch hoàn chỉnh từ tối ưu hóa lộ trình đến so sánh khách sạn. Nó cũng tóm tắt và cung cấp các tài liệu mới nhất và báo cáo phân tích xu hướng trong các lĩnh vực học thuật hoặc ngành nghề.

Giỏ hàng Toàn cầu và Mua sắm Tự động

E-commerce hoàn toàn được chuyển giao cho các Ajan trí tuệ nhân tạo nhờ vào Giỏ hàng Toàn cầu (Universal Cart) được công bố bởi Phó Chủ tịch Nhóm Quảng cáo và Thương mại Google Vidhya Srinivasan. Hệ thống này, được xây dựng trên cơ sở hạ tầng Giao thức Thương mại Toàn cầu (Universal Commerce Protocol – UCP), hợp nhất các giỏ hàng từ các trang web khác nhau tại một điểm.

Nhờ giao thức Ajan Thanh toán mới (Agent Payments – APM), người dùng có thể định nghĩa một cách an toàn giới hạn chi tiêu và tiêu chí cho các Ajan của họ. Khi Ajan tìm thấy một sản phẩm dưới mức giá xác định, họ có thể hoàn tất giao dịch một cách an toàn thay mặt cho người dùng.

Những Trợ lý Giúp Cuộc sống Dễ dàng hơn: Gemini Spark và Android Halo

Gemini Spark được giới thiệu bởi Phó Chủ tịch Google Labs Josh Woodward, nổi bật như một Ajan trí tuệ nhân tạo cá nhân thế hệ mới điều phối cuộc sống kỹ thuật số của người dùng. Spark hoạt động liên tục trong nền, không chỉ thực hiện các lệnh mà còn đưa ra các quyết định chủ động bằng cách dự đoán các bước tiếp theo.

Các khả năng cốt lõi của Spark

Tự động hóa Thói quen và Kích hoạt: Kiểm tra các bản sao kê thẻ tín dụng vào một ngày nhất định hàng tháng và thông báo cho người dùng về các khoản chi đáng ngờ.

Học các Kỹ năng Mới: Người dùng có thể định nghĩa các kỹ năng đặc biệt cho Spark như “Kiểm tra cổng thông tin bài tập về nhà của con tôi mỗi ngày vào lúc 16:00 và tóm tắt cho tôi khi có nhiệm vụ mới được thêm vào”.

Tích hợp Công cụ Nâng cao: Thiết lập tích hợp sâu với Gmail, Google Tài liệu, Lịch và Drive để sắp xếp các cuộc họp, tổ chức tài liệu du lịch và chuẩn bị các tệp cần thiết.

Ở phía di động, Android Halo cung cấp một giao diện Ajan chủ động được tích hợp sẵn vào màn hình khóa và màn hình chính của hệ điều hành. Halo giúp người dùng không bị lạc giữa các ứng dụng và cung cấp thông tin cần thiết (ví dụ như số cửa của chuyến bay sắp tới hoặc tình trạng giao thông) dưới dạng widget hoặc thông báo động ngay lập tức. Nó cũng cho phép điều khiển điện thoại hoàn toàn bằng giọng nói.

Giải pháp nâng cao cho Thế giới Kinh doanh và Sáng tạo

Phó Chủ tịch Quản lý Sản phẩm Google Workspace Yulia Kwon Kim chia sẻ các tính năng mới sẽ nâng cao hiệu quả trong kinh doanh. Các khả năng kiểm soát giọng nói được nâng cao trên Gmail, Tài liệu và Keep, đồng thời cung cấp các công cụ mới hỗ trợ năng suất doanh nghiệp.

Tính năngMô tảGmail LivePhân tích email trực tiếp. Tóm tắt nhanh các chuỗi email dài bằng giọng nói và tạo ra các bản nháp phản hồi chuyên nghiệp bằng lệnh giọng nói tức thì.Google PixLà công cụ nghệ thuật AI tích hợp trong Workspace, tạo ra hình ảnh và đồ họa chất lượng cao, không bản quyền phù hợp với bản sắc doanh nghiệp cho các bài thuyết trình và tài liệu.Bản nháp Cá nhân hóaTự động ưu tiên các email đến bằng cách phân tích mức độ khẩn cấp và chuẩn bị các phản hồi phù hợp với ngôn ngữ trong các cuộc trao đổi trước đó.

Google Flow và Google Flow Music được phát triển cho các chuyên gia sáng tạo, đảm nhận vai trò đối tác tương tác từ giai đoạn ý tưởng đến giai đoạn sản xuất. Nền tảng này, dựa trên sức mạnh của mô hình Gemini Omni, loại bỏ các quy trình render và biên tập tốn thời gian trong chỉnh sửa video và hình ảnh. Google Flow Music cho phép phân tích các phần của bài hát theo giọng, trống và guitar, thực hiện các chỉnh sửa tinh vi, điều chỉnh lại giai điệu và sản xuất các phiên bản cover mới trong vòng vài giây.

Cơ sở Hạ tầng Phát triển, An ninh và Các Mô hình Đăng ký Mới

Google cũng giới thiệu các công cụ mới sẽ phát triển hệ sinh thái nhà phát triển. Kiến trúc framework thế hệ mới Google Antigravity cho phép các nhà phát triển tạo, kiểm tra và triển khai các Ajan chủ động với độ trễ thấp và an toàn cao hơn. Antigravity CLI cho phép quản lý nhanh chóng các kiến trúc Ajan qua terminal.

Nhờ vào các Ajan Quản lý trong Gemini API, các nhà phát triển giờ có thể gọi các Ajan thông minh trực tiếp qua API mà không cần phải viết mã xác thực phức tạp, tích hợp công cụ và quản lý bộ nhớ. Một cuộc thi Hackathon Build with Gemini XPRICE nhằm khuyến khích các nhà phát triển trên toàn cầu cũng đã được khởi động, với đêm chung kết diễn ra vào tháng Chín tại Los Angeles.

Bảo mật và Danh tính Nội dung (Trust & Safety)

Các tiêu chuẩn C2PA (Content Provenance and Authenticity) được áp dụng bắt buộc trong toàn bộ hệ sinh thái Google (Tìm kiếm, Hình ảnh, YouTube) nhằm ngăn chặn việc thao túng nội dung số. API Phát hiện Nội dung AI mới được giới thiệu phân tích sâu sắc một văn bản, hình ảnh hoặc video có phải do AI tạo ra hay không, từ đó nâng cao an toàn số.

Các Gói Đăng ký Mới và Sáng kiến YouTube

Một kế hoạch AI Ultra mới trị giá 100 đô la mỗi tháng được công bố dành cho các nhà phát triển và các chuyên gia xử lý dữ liệu lớn. Kế hoạch này bao gồm quyền truy cập không giới hạn vào các mô hình Gemini 3.5 Ultra và Flash, phiên bản cao nhất của Ajan cá nhân chủ động Gemini Spark, trợ lý Daily Brief tự động và đăng ký YouTube Premium cá nhân.

Ở phía YouTube, tính năng 'Hỏi YouTube' (Ask YouTube) cho phép người xem tương tác với video. Người xem có thể đặt câu hỏi về nội dung của các video dài và lấy danh sách nguyên liệu của các công thức nấu ăn ngay lập tức, trong khi các nhà sáng tạo nội dung cũng nhận được các công cụ remix video được hỗ trợ bởi Gemini Omni và phụ đề tự động.

Cuối cùng, mô hình toàn cầu đa mục đích Project Genie đang được chi tiết hóa, có khả năng mô phỏng các thế giới 3D tương tác và khám phá từ các dữ liệu đầu vào văn bản hoặc hình ảnh. Công nghệ này, kết hợp với dữ liệu Google Street View, cho phép tái thiết kế các địa điểm thực tế, trong khi CEO của Google Cloud, Thomas Kurian, chia sẻ tầm nhìn 'Blueprint for the Agentic Enterprise' hoạt động hoàn toàn tương thích trong các lĩnh vực như an ninh mạng, quan hệ khách hàng và chuỗi cung ứng.