Khi lớp an toàn trượt chân: Gemini 3 Pro bị phát hiện hướng dẫn tạo vũ khí sinh học trong thử nghiệm

M
Minigame

Khi lớp an toàn trượt chân: Gemini 3 Pro bị phát hiện hướng dẫn tạo vũ khí sinh học trong thử nghiệm

Gemini 3 Pro đang được Google đặt nhiều kỳ vọng về khả năng xử lý thông tin và tư duy, nhưng một báo cáo mới từ Hàn Quốc lại tạo ra làn sóng hoài nghi về tính an toàn của mô hình này. Trong một bài kiểm tra riêng, một công ty an ninh tại Seoul cho biết họ đã tìm cách vượt qua các lớp bảo vệ và nhận được phản hồi liên quan đến các nội dung mà đáng lý bất kỳ hệ thống AI có trách nhiệm nào cũng phải từ chối ngay lập tức.


Một công ty bảo mật nói đã “vượt rào” Gemini 3 Pro và nhận được câu trả lời cực kỳ nhạy cảm


Sự việc bắt đầu khi tờ Maeil Business Newspaper đưa tin về kết quả thử nghiệm của Aim Intelligence, một công ty chuyên đánh giá an ninh AI tại Seoul. Theo báo cáo này, trong môi trường kiểm thử kín, nhóm đã khiến Gemini 3 Pro đưa ra câu trả lời chi tiết về cách tạo ra mối đe dọa sinh học và những vật dụng có thể bị biến thành vũ khí. Diễn biến này không chỉ gợi lên lo ngại về khả năng vượt ngoài kiểm soát của các mô hình AI hiện đại, mà còn nhấn mạnh rằng không một hệ thống nào thật sự miễn nhiễm trước những nỗ lực khai thác có chủ đích.

Gemini 3 Pro (Ảnh: Internet)

Gemini 3 Pro (Ảnh: Internet)

Điều đáng chú ý là Aim Intelligence không công bố bất kỳ đầu ra, đoạn trao đổi hay phương pháp thử nghiệm nào. Thông tin chỉ dừng ở mức tuyên bố, khiến người ngoài khó có cơ sở để đánh giá độ tin cậy hoặc khả năng lặp lại. Khi một cáo buộc nghiêm trọng xuất hiện mà thiếu dữ liệu minh chứng, việc đặt câu hỏi là hoàn toàn dễ hiểu. Đây cũng là điều mà cả Google và cộng đồng kỹ thuật chắc chắn muốn được làm rõ sớm.

Nhóm nghiên cứu còn đề cập rằng Gemini 3 Pro đã tạo ra một bài thuyết trình mang tính châm biếm với tiêu đề khá lạ, nghe giống một trò đùa hơn là sản phẩm nghiêm túc. Chi tiết này khiến câu chuyện trở nên khó đoán hơn. Một mặt, nó gợi cảm giác bất ổn về hành vi của mô hình. Mặt khác, nó mở ra câu hỏi về loại gợi ý mà nhóm thử nghiệm đã sử dụng để dẫn mô hình đến phản hồi như vậy.

Câu chuyện này tiếp nối hàng loạt ví dụ gần đây, cho thấy các mô hình AI có thể phản ứng bất ngờ khi gặp các dạng gợi ý được biến tấu. Nguy cơ nằm ở chỗ nội dung nguy hiểm có thể được “đóng gói” trong những lớp ngôn từ bình thường như thơ hay trò đố, khiến hệ thống khó nhận diện. Từ các trò trêu đùa vô hại cho đến những bài kiểm tra cố tình khai thác, nhiều mô hình lớn đã lộ ra điểm yếu khi người dùng thay đổi cách đặt câu hỏi.

Gemini Voice (Ảnh: Internet)

Gemini Voice (Ảnh: Internet)

Google vẫn thường nhấn mạnh rằng an toàn là ưu tiên hàng đầu và Gemini 3 Pro là một trong những mô hình được đầu tư mạnh vào việc kiểm soát hành vi. Tuy vậy, trước một báo cáo như thế này, dù thiếu chứng cứ, công ty chắc chắn đứng trước áp lực phải chứng minh khả năng phòng thủ trong những tình huống ngoài dự kiến. Thử nghiệm được dàn dựng đẹp trong buổi giới thiệu không còn đủ khi mô hình ngày càng hiện diện trong đời sống thật.

Ở thời điểm hiện tại, điều người dùng mong chờ là quy trình kiểm chứng minh bạch hơn, thay vì chỉ trấn an. Nếu thử nghiệm của Aim Intelligence có cơ sở, Google cần chỉ ra điểm yếu nằm ở đâu. Nếu kết quả thiếu độ tin cậy, điều đó cũng cần được nói rõ để tránh gây hiểu lầm.

Sự cố quanh Gemini 3 Pro nhắc rằng cuộc đua giữa sức mạnh và an toàn của AI chưa bao giờ đơn giản. Mỗi bước tiến về khả năng đều đòi hỏi sự thận trọng tương ứng về kiểm soát. Và đôi khi, một báo cáo mơ hồ cũng đủ để cả ngành phải chậm lại đôi chút để nhìn lại cách mình đang xây dựng tương lai của trí tuệ nhân tạo.

DeepSeek trở lại đầy khí thế: V3.2 và V3.2 Speciale tự tin thách thức những mô hình AI dẫn đầu


Sau một năm khiến ngành AI xôn xao, DeepSeek tiếp tục tung ra hai mô hình mới và đưa ra những tuyên bố đủ để cả thị trường phải chú ý. Lần này, hãng không chỉ nói về sức mạnh mà còn nhấn mạnh cách họ tiếp cận bài toán hiệu năng theo hướng khác với các phòng thí nghiệm lớn tại Mỹ.

Tinh gọn nhưng mạnh mẽ: Chiến lược phát triển của DeepSeek


DeepSeek V3.2 và bản cao cấp hơn là V3.2 Speciale được giới thiệu như những mô hình có khả năng cạnh tranh trực tiếp với các hệ thống AI hàng đầu. Thay vì chạy theo cụm máy khổng lồ và chip cao cấp, công ty tập trung tối ưu hiệu năng để mô hình vận hành tốt trên phần cứng phổ thông. Các mô hình mới vẫn xử lý được các tác vụ phức tạp, bao gồm các bài toán cần suy luận nhiều bước, đồng thời giữ chi phí triển khai ở mức hợp lý.

DeepSeek (Ảnh: Internet)

DeepSeek (Ảnh: Internet)

Một trong những yếu tố giúp DeepSeek nâng cao hiệu năng là quá trình huấn luyện trên hơn 85.000 nhiệm vụ phức tạp, đa bước, được tạo ra bởi hệ thống “agentic task synthesis” của công ty. Cơ chế sparse attention tùy chỉnh cũng giúp mô hình xử lý ngữ cảnh dài hiệu quả, cải thiện khả năng tư duy logic và suy luận sâu.

Trải nghiệm thực tế và minh bạch: V3.2 mở cửa cho người dùng


Điểm gây chú ý lớn là phiên bản V3.2 Speciale, được DeepSeek khẳng định đạt kết quả ấn tượng tại các kỳ thi quốc tế như Olympic Toán và Olympic Tin học, những thước đo khó cho năng lực suy luận của AI. Công ty cũng công bố các bài làm cuối cùng để mọi người kiểm chứng, mở đường cho đánh giá độc lập. DeepSeek cho biết trên các bài kiểm tra nội bộ, V3.2 Speciale có thể vượt GPT-5 và đạt hiệu quả tương đương với Gemini 3 Pro ở những tác vụ đòi hỏi suy luận cao, nhấn mạnh khả năng xử lý logic và tư duy đa bước của mô hình.

DeepSeek V3.2 Speciale được đánh giá có khả năng suy luận vượt GPT-5 và tương đương Gemini 3 Pro, nổi bật trong các bài kiểm tra logic và đa bước, thể hiện sức cạnh tranh trực tiếp với các mô hình AI dẫn đầu hiện nay (Ảnh: Internet)

DeepSeek V3.2 Speciale được đánh giá có khả năng suy luận vượt GPT-5 và tương đương Gemini 3 Pro, nổi bật trong các bài kiểm tra logic và đa bước, thể hiện sức cạnh tranh trực tiếp với các mô hình AI dẫn đầu hiện nay (Ảnh: Internet)

DeepSeek V3.2 hiện đã chính thức mở cho người dùng trải nghiệm qua website, ứng dụng di động và API, cho phép cộng đồng kiểm tra khả năng suy luận và phản hồi trong thực tế. Bản Speciale chỉ cung cấp qua API tạm thời và hoạt động như mô hình suy luận thuần, nhằm hạn chế rủi ro trong giai đoạn thử nghiệm đầu tiên.

Câu chuyện này cho thấy DeepSeek không chỉ muốn tham gia cuộc đua AI, mà còn muốn thay đổi cách thế giới nhìn nhận về chi phí và hiệu quả. Trong một thị trường thiên về mô hình ngày càng lớn, công ty đang chứng minh rằng thông minh và hiệu quả có thể song hành, tạo nên một làn gió mới đầy hứng thú cho ngành AI, đồng thời đặt ra thách thức rõ ràng cho các “ông lớn” như OpenAI hay Google.

 
Tags
None
0
0
0

Chung cộng đồng

Cộng đồng nổi bật

Work-life balance

5
Người theo dõi
62
Bài đăng

Tin Tức Du Lịch

5
Người theo dõi
4K
Bài đăng

Mẹo du lịch

5
Người theo dõi
102
Bài đăng

Văn hoá & Tập tục

5
Người theo dõi
13
Bài đăng

Khám phá Địa danh

5
Người theo dõi
633
Bài đăng

Lịch sử & Sự kiện

5
Người theo dõi
3
Bài đăng

Vận hành dịch vụ

4
Người theo dõi
0
Bài đăng

Khởi nghiệp du lịch

4
Người theo dõi
0
Bài đăng

Mẹo Hay

4
Người theo dõi
178
Bài đăng

Trung Tâm Điều Hành

4
Người theo dõi
0
Bài đăng
Top