Google ra mắt Gemini Agent – công cụ AI có khả năng hỗ trợ người dùng như trợ lý thật

A
aozora

Google ra mắt Gemini Agent – công cụ AI có khả năng hỗ trợ người dùng như trợ lý thật

Cùng với Gemini 3, Google đã giới thiệu một công cụ AI mới có tên là Gemini Agent được cung cấp trên máy tính dành cho người dùng đã đăng ký tài khoản Google AI Ultra tại Mỹ. Gemini Agent hoạt động giống như một trợ lý cá nhân thực thụ hơn là một chatbot đơn thuần.


Gemini Agent là gì?


Thay vì chỉ trả lời câu hỏi đơn giản như thông thường, Gemini Agent có thể lập kế hoạch, khám phá và thực hiện các tác vụ phức tạp thay cho người dùng. Nhưng trước khi công cụ này thực hiện bất kỳ hành động nào, người dùng phải cấp cho nó các quyền cần thiết chẳng hạn như quyền truy cập vào trình duyệt web, tài khoản Gmail hoặc Lịch. Gemini Agent cũng yêu cầu người dùng cho phép đối với những tác vụ như gửi tin nhắn hay mua hàng. Ngoài ra người dùng có thể xóa các thông tin đã chia sẻ với nó bất cứ lúc nào.

Chọn công cụ Gemini Agent trong menu thả xuống (Ảnh: Internet)

Chọn công cụ Gemini Agent trong menu thả xuống (Ảnh: Internet)
Các gợi ý xuất hiện khi chọn Tóm tắt công việc trên Gemini (Ảnh: Internet)

Các gợi ý xuất hiện khi chọn “Tóm tắt công việc” trên Gemini (Ảnh: Internet)
Các gợi ý xuất hiện khi chọn Thực hiện nhiệm vụ cho tôi trên Gemini (Ảnh: Internet)

Các gợi ý xuất hiện khi chọn “Thực hiện nhiệm vụ cho tôi” trên Gemini (Ảnh: Internet)

Về khả năng thực hiện công việc, Gemini Agent sở hữu nhiều tính năng đa dạng. Nó có thể sắp xếp lịch trình, quản lý email và tìm kiếm thông tin từ email, tạo slide, chuẩn bị tóm tắt cá nhân cho ngày làm việc của bạn, ngoài ra còn nhiều tính năng khác. Điểm tuyệt vời nhất là bạn có thể đưa ra nhiều yêu cầu khác nhau trong một câu lệnh bằng ngôn ngữ tự nhiên. Bạn cũng có thể xem thời gian và cách thức Gemini Agent xử lý yêu cầu của bạn, cũng như đặt câu hỏi tiếp theo sau khi hoàn thành.

Hỗ trợ người dùng thực hiện mọi việc như trợ lý thật


Tùy thuộc vào nhiệm vụ cụ thể, Gemini Agent có thể mở một trình duyệt web độc lập để tìm kiếm dữ liệu cần thiết, thậm chí yêu cầu bạn “cho phép chia sẻ nội dung” trước khi thực hiện hành động. Sau đó nó sẽ mở một cửa sổ mới và tải một phiên bản trình duyệt Chrome mới vào đó, tự động lướt trang và nhấp vào các liên kết để hoàn thành nhiệm vụ được giao. Trong quá trình đó, bất cứ lúc nào bạn cũng có thể di chuột qua bảng điều khiển trình duyệt và nhấp vào “Kiểm soát” để xử lý theo cách thủ công.

Yêu cầu Gemini Agent lướt trang web thay cho người dùng (Ảnh: Internet)

Yêu cầu Gemini Agent lướt trang web thay cho người dùng (Ảnh: Internet)
Cho phép Gemini Agent lướt trang web thay cho người dùng (Ảnh: Internet)

Cho phép Gemini Agent lướt trang web thay cho người dùng (Ảnh: Internet)
Kiểm soát việc Gemini Agent có lưu dữ liệu trình duyệt từ xa của người dùng hay không (Ảnh: Internet)

Kiểm soát việc Gemini Agent có lưu dữ liệu trình duyệt từ xa của người dùng hay không (Ảnh: Internet)

Nếu bạn yêu cầu Gemini Agent thực hiện một việc mà nó có thể làm bằng cách sử dụng Google Apps đã kết nối, thì nó có thể không cần mở cửa sổ trình duyệt. Ví dụ bạn có thể nói với Gemini Agent những câu lệnh như “Tìm tin nhắn chưa đọc mới nhất từ Hadlee trong hộp thư đến của tôi. Kiểm tra Drive của tôi xem có bất kỳ file nào được kết nối với dự án mà anh ấy đã đề cập không. Soạn thảo một câu trả lời ngắn cho anh ấy biết tôi sẽ xem xét mọi thứ và liên hệ lại vào ngày mai”, sau đó Gemini Agent sẽ thực hiện các tác vụ này bằng cách kết nối trực tiếp với tài khoản Gmail và Drive của bạn.

Một số ví dụ khác về các loại công việc mà Gemini Agent có thể xử lý cho người dùng bao gồm:

  • Trợ giúp qua email: Tìm email gần đây, thu thập tài liệu liên quan, soạn thảo phản hồi hoặc quét các tin nhắn chưa đọc để tìm tác vụ và thêm chúng vào Google Tasks.
  • Tóm tắt hàng ngày: Tạo tóm tắt buổi sáng bao gồm các cuộc họp quan trọng, email chính, tin tức địa phương hoặc cập nhật tin tức thể thao.
  • Đặt chỗ và đặt hàng: Với tính năng duyệt trực tiếp, Gemini Agent có thể đặt chỗ ăn tối hoặc mua vé trực tuyến.
  • Quản lý lịch: Tìm kiếm và tạo sự kiện lịch, chuẩn bị ghi chú cuộc họp, v.v.
  • Xây dựng bài thuyết trình: Nghiên cứu một chủ đề và tự động chuyển kết quả thành slide.

Về bản chất, Gemini Agent hoạt động khá giống với các trình duyệt web AI hiện đại như Comet của Perplexity và Atlas của ChatGPT, không chỉ hiển thị trang web mà còn thực hiện các hành động trên đó. Nhưng không giống như Comet hay Atlas, Gemini Agent không phải là một phần tích hợp đầy đủ của bất kỳ trình duyệt web nào, nghĩa là nó không có quyền theo dõi tất cả thông tin đăng nhập và hoạt động duyệt web đã lưu của người dùng. Điều này làm cho nó kém linh hoạt hơn nhưng cũng ít rủi ro bảo mật hơn khi sử dụng, vì bạn sẽ không thể tự động hóa các tác vụ trên các dịch vụ trực tuyến nhạy cảm. Tuy nhiên Gemini Agent vẫn không tránh khỏi các cuộc tấn công mạng của hacker, vì vậy hãy sử dụng nó một cách thận trọng.


Mời bạn xem thêm các bài liên quan:


Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!
 
Tags
None
18
0
0

Chung cộng đồng

Cộng đồng nổi bật

Work-life balance

5
Người theo dõi
62
Bài đăng

Tin Tức Du Lịch

5
Người theo dõi
4K
Bài đăng

Mẹo du lịch

5
Người theo dõi
102
Bài đăng

Văn hoá & Tập tục

5
Người theo dõi
13
Bài đăng

Khám phá Địa danh

5
Người theo dõi
582
Bài đăng

Lịch sử & Sự kiện

5
Người theo dõi
3
Bài đăng

Vận hành dịch vụ

4
Người theo dõi
0
Bài đăng

Khởi nghiệp du lịch

4
Người theo dõi
0
Bài đăng

Mẹo Hay

4
Người theo dõi
178
Bài đăng

Trung Tâm Điều Hành

4
Người theo dõi
0
Bài đăng
Top