CAN THO CITY DEPARTMENT OF SCIENCE AND TECHNOLOGY
Trí tuệ nhân tạo tự thiết kế “giáo án” huấn luyện
Khác với con người, máy tính không cảm thấy nhàm chán hoặc thất vọng khi một bài học quá dễ hoặc quá khó. Nhưng máy tính cũng giống con người ở chỗ: nó sẽ học hiệu quả hơn khi có một giáo án huấn luyện “vừa phải” phù hợp với trình độ của mình.

Các nhà nghiên cứu mới đây đã phát triển các AI tự thiết kế các bài học với độ khó tăng dần.

Việc tìm ra một giáo án phù hợp không hề dễ dàng, vì vậy các nhà khoa học máy tính đã tự hỏi: Điều gì sẽ xảy ra nếu họ có thể khiến trí thông minh nhân tạo (AI) tự thiết kế bài học cho mình?

Một số nghiên cứu nhằm trả lời câu hỏi đó đã được công bố tại Hội nghị quốc tế hàng năm về hệ thống xử lý thông tin mạng thần kinh nhân tạo (NeurIPS). Bằng việc tạo ra AI có thể tìm ra cách tốt nhất để tự dạy mình, các nghiên cứu mới này giúp tăng tốc độ học tập của các mô hình máy tính ô tô tự lái và robot gia dụng, và giải các bài toán khó trước đây.

Trong một thử nghiệm, một chương trình AI cố gắng vượt qua mê cung 2D để đến đích bằng phương pháp thử và sai. Để tạo ra các mê cung ngày càng khó và cải thiện dần khả năng của AI, các nhà nghiên cứu - đứng đầu là nghiên cứu sinh Michael Dennis tại Đại học California (UC) và Natasha Jaques, nhà khoa học nghiên cứu tại Google - đã dùng hai phương pháp. Tuy nhiên cả hai đều không hiệu quả. Một phương pháp phân phối ngẫu nhiên các vật cản; với cách này, AI không học được nhiều. Phương pháp kia lưu lại những bản đồ AI đã giải trong quá khứ và tối đa hóa độ khó tương ứng; nhưng cách này khiến mê cung trở nên quá khó - và đôi khi thậm chí không thể giải được.

Vì vậy, các nhà khoa học đã sáng tạo một cách tiếp cận mới mà họ gọi là PAIRED. Đầu tiên, họ ghép cặp AI của mình với một AI gần như giống hệt, nhưng có một vài điểm khác - họ gọi đó là "AI đối thủ". Sau đó, họ cho một AI thứ ba, gọi là AI thiết kế, thiết kế các mê cung phù hợp với các đặc điểm và dễ hoàn thành hơn cho AI đối thủ - nhưng khó cho AI ban đầu. Cách làm này khiến các bản đồ luôn nằm ở mức chỉ khó hơn một chút so với khả năng giải quyết của AI chính. AI thiết kế bản đồ cũng sử dụng mạng nơ-ron - một chương trình lấy cảm hứng từ kiến ​​trúc của não - để học cách thực hiện nhiệm vụ của nó qua nhiều lần thử nghiệm.

 

Sau khi đào tạo theo cách này, các nhà nghiên cứu cho AI chính thử giải một loạt các mê cung mới và khó. Nếu được đào tạo bằng cách sử dụng hai phương pháp cũ, AI không giải được mê cung nào mới. Nhưng sau khi được đào tạo với PAIRED, nó đã giải quyết được 1/5 số mê cung mới. "Chúng tôi rất phấn khích khi PAIRED có hiệu quả ngay từ thử nghiệm đầu tiên," Dennis nói.

Trong một nghiên cứu khác, cũng được trình bày tại hội thảo NeurIPS, Jaques và các đồng nghiệp tại Google đã sử dụng PAIRED để dạy một AI điền vào các biểu mẫu web để đặt chuyến bay. Nếu được đào tạo bằng các phương pháp đơn giản hơn, AI sẽ luôn thất bại, nhưng AI được đào tạo với phương pháp PAIRED đã làm thành công khoảng 50% số nhiệm vụ được giao.

Bart Selman, nhà khoa học máy tính tại Đại học Cornell và là chủ tịch Hiệp hội Vì sự phát triển của trí tuệ nhân tạo, cho biết, phương pháp PAIRED là một cách thông minh để khiến AI học hỏi.

Selman và các đồng nghiệp cũng trình bày một cách tiếp cận khác tại Hội nghị. Nhiệm vụ cho AI của họ là trò chơi Sokoban, trong đó AI phải đẩy các khối đến các vị trí mục tiêu. Nhưng các khối có thể đi vào ngõ cụt, vì vậy để hoàn thành nhiệm vụ, phải lên kế hoạch trước hàng trăm bước.

AI thiết kế của nhóm Selman tạo ra một bộ các nhiệm vụ đơn giản, với ít khối hơn, hơn để AI chính luyện tập. Sau đó, dựa trên hiệu suất của AI chính đối với các nhiệm vụ đơn giản, AI thiết kế sẽ đưa ra các câu đố khó hơn mà AI chính thỉnh thoảng mới giải được, tạo ra một giáo án huấn luyện phù hợp và hiệu quả.

Các nhà nghiên cứu đã thử nghiệm AI của họ trên 225 vấn đề mà chưa máy tính nào giải được và nó đã giải được 80% trong số đó.

Pieter Abbeel, nhà khoa học máy tính tại UC Berkeley, nói rằng các phương pháp mới này thậm chí có thể được sử dụng cho học sinh: AI có thể giúp điều chỉnh các bài tập thành khó hơn hoặc dễ hơn để phù hợp với nhu cầu của từng học sinh.

Hoàng Nam

www.khoahocphattrien.vn (ctngoc)
Most viewed news

Apple Plans to Transform Siri into a Chatbot

Apple is reportedly preparing a major upgrade for iOS 27 and macOS 27, with a strong focus on AI-powered photo editing and a redesigned Siri that behaves more like a chatbot than ever before.

YouTube Tests New AI-Powered Q&A Search Mode

YouTube is experimenting with a new AI-driven search experience designed for users who often turn to the platform for recipes, travel planning, or step-by-step tutorials. Instead of simply returning a list of videos, the new tool allows users to ask direct questions and receive structured, step-by-step answers that blend text, short clips, and full-length videos.

Russian Engineers Double CNC Processing Speed with Breakthrough Machine Design

In a major leap for modern manufacturing, researchers at Izhevsk State Technical University (IzhGTU) named after M.T. Kalashnikov have developed a new method for operating CNC machining centers that doubles productivity without requiring expensive hardware upgrades.

Xiaomi’s Next-Gen XRING O3 Chip Leak Points to Foldable Phone Debut

Xiaomi is reportedly preparing to launch its self-developed XRING O3 processor, with leaks suggesting it will debut inside the upcoming Xiaomi 17 Fold. The new chip appears in Mi Code under the codename “lhasa”, hinting at a design optimized for multitasking on foldable devices.

Resolutely promoting digital transformation, developing science and technology, and reforming administrative procedures

The Government Office issued Notice No. 167/TB-VPCP concluding the second meeting in 2026 of the Government’s Steering Committee for the development of science, technology, innovation, digital transformation, and Project 06.

Scientific and technological autonomy: From accumulated foundations to value creation

Strategic autonomy in science and technology is no longer a distant goal but has become an urgent requirement as the accumulated foundation is now sufficient and the time for action has matured. With distinctive advantages such as rare earth resources, tropical forest ecosystems, abundant fisheries, and an important geostrategic position, Vietnam has a solid basis to develop and master technologies from its internal capacity, thereby creating differentiated and sustainable competitive advantages.

Nurturing high-quality technology human resources from P-Innovation 2026

On April 3, the Posts and Telecommunications Institute of Technology held the Final Round of the P-Innovation 2026 competition, aiming to promote the development of an innovation ecosystem within the university environment, associated with training high-quality human resources and developing technology products.

Guidelines for the dedicated data transmission network serving Party and State agencies

The Minister of Science and Technology has issued Circular No. 06/2026/TT-BKHCN stipulating details and providing guidance on several provisions of Decision No. 33/2025/QĐ-TTg dated 15 September 2025 of the Prime Minister on the Dedicated Data Transmission Network serving Party and State agencies.

The development of science, technology, and innovation becomes the main driver of economic growth.

Deputy Prime Minister Nguyen Chi Dung signed Decision No. 604/QD-TTg dated 02/4/2026 approving the adjustment and supplementation of the Strategy for the development of science, technology, and innovation to 2030 (the Strategy).

Related news
CAN THO CITY DEPARTMENT OF SCIENCE AND TECHNOLOGY

Copyright @ 2021 belongs to the Can Tho City Department of Science and Technology
Address: No. 02, Ly Thuong Kiet, Ninh Kieu Ward, Can Tho City
Phone: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Head of the Editorial Board: Mr. Tran Dong Phuong An - Deputy Director of the
Can Tho City Department of Science and Technology

Copyright © 2021 All rights reserved | This template is made by CASTI'1987