CAN THO CITY DEPARTMENT OF SCIENCE AND TECHNOLOGY
AI ghi nhận biểu cảm trong nghệ thuật thị giác
Các chuyên gia về trí tuệ nhân tạo đã có khả năng tạo ra những máy tính có thể “thấy” thế giới xung quanh nó – ghi nhận các vật thể, con vật, và những hành động trong tầm hiểu biết của chúng. Đây là những công nghệ nền tảng cho ô tô tự lái, máy bay không người lái và các hệ an ninh trong tương lai.

Hiện tại thì một nhóm nghiên cứu đang nỗ lực làm việc để dạy các máy tính ghi nhận không chỉ các vật thể trong một bức ảnh mà còn cách những bức ảnh đó khơi gợi cảm xúc của con người như thế nào – ví dụ các thuật toán với trí tuệ cảm xúc.

“Khả năng này sẽ trở thành yếu tố quan trọng để tạo ra trí tuệ nhân tạo không chỉ thông minh hơn mà còn có chất người hơn”, Panos Achlioptas, một nghiên cứu sinh về khoa học máy tính tại trường đại học Stanford hiện đang cộng tác với những đồng nghiệp Pháp và Saudi Arabia, nói.

Để đạt được mục tiêu này, Achlioptas và các thành viên của nhóm nghiên cứu đã thu thập một bộ dữ liệu mới mang tên ArtEmis, mới được xuất bản gần đây trên arXiv như một dạng tiền ấn phẩm. Bộ dữ liệu đó có khoảng 81.000 bức vẽ WikiArt và chứa 440.000 câu phản hồi dưới do hơn 6.500 người viết ra để chỉ dấu cách mỗi bức tranh khơi gợi cảm xúc gì ở họ - và bao gồm những giải thích về việc tại sao họ lại chọn lấy một biểu cảm nhất định. Sử dụng những phản hồi đó, Achlioptas và nhóm nghiên cứu do giáo sư Stanford Leonidas Guibas, đã huấn luyện hệ nhận dạng AI cho phép phản hồi chữ viết, qua đó cho phép máy tính tạo ra những phản hồi cảm xúc với nghệ thuật thị giác và chứng minh những cảm xúc đó trong ngôn ngữ.

Các nhà nghiên cứu đã chọn sử dụng nghệ thuật thể hiện cảm xúc một cách cụ thể và rành mạch, vì mục tiêu của một hoa sĩ là khơi gợi cảm xúc ở người xem. ArtEmis hướng đến mọi chủ đề, từ tranh tĩnh vật đến chân dung hay tranh trừu tượng.

Công trình này là một cách tiếp cận mới trong thị giác máy tính, Guibas lưu ý. Anh là một thanh viên của Phòng thí nghiệm AI và Viện nghiên cứu Trí tuệ nhân tạo lấy con người làm trung tâm ở Stanford. “Công việc thu thập thị giác máy tính cổ điển thường nắm bắt nội dung theo nghĩa đen”, Guibas nói. “Có ba con chó trong bức ảnh này hoặc ai đó đang uống cà phê từ một cái cốc. Nay thì thay cách đó, chúng tôi cần những miêu tả xác định nội dung cảm xúc”.

Nắm bắt cảm xúc

Thuật toán này ghi nhận tác phẩm của các nghệ sĩ vào một trong tám hạng mục biểu cảm – phạm vi trải rộng từ kinh ngạc đến thích thú, sợ hãi hay buồn rầu – và sau đó giải thích bằng văn bản những gì trong bức ảnh thể hiện cảm xúc đó. (Hãy xem min họa. Tất cả các bức tranh đều được thuật toán này đánh giá).

“Chiếc máy tính này đang thực hiện điều đó”, Achlioptas nói. “Chúng tôi có thể chứng minh đây là một bức ảnh hoàn toàn mới và nó sẽ nói với chúng ta biết là một người có thể cảm nhận được gì nếu thấy bức ảnh đó”.

Các nhà nghiên cứu cho biết, thật đáng chú ý là những chú thích phản ánh một cách chính xác nội dung trừu tượng của bức ảnh theo những cách vượt quá khả năng cả những thị giác máy tính hiện tại, vốn được huấn luyện trên những bộ dữ liệu ảnh tài liệu như Coco.

Hơn nữa, thuật toán mới này không chỉ đơn giản là nắm bắt được trải nghiệm cảm xúc của một bức ảnh hoàn thiện mà còn có thể hiểu được những biểu cảm khác trong một bức ảnh nhất định. Ví dụ trong bức tranh nổi tiếng về cảnh cái đầu bị chém của John the Baptist do danh họa Rembrandt vẽ, ArtEmis phân biệt không chỉ nỗi đau trên khuôn mặt của người đàn ông cầm cái đầu của John the Baptist mà còn cả “sự mãn nguyện” trên khuôn mặt của Salome, người phụ nữ đã cầu xin chặt đầu John the Baptist.

Achlioptas nêu, ngay cả khi ArtEmis chưa đủ độ phức tạp và tinh tế để đánh giá được ý đồ của từng tác giả có thể khác biệt trong bối cảnh của mỗi bức họa, công cụ này cũng vẫn có thể nhận biết được tính chủ quan và sự thay đổi trong phản hồi của con người. “Không phải mỗi người đều thấy và cảm nhận giống nhau khi ngắm một tác phẩm nghệ thuật”, anh nói. Ví dụ, “Tôi có thể cảm thấy hạnh phúc khi nhìn thấy bức ‘Mona Lisa’ nhưng giáo sư Guibas có thể cảm thấy buồn bã. ArtEmis có thể phân biệt được những điều khác biệt này”.

Công cụ của một nghệ sĩ

Trong tương lai gần, các nhà nghiên cứu dự đoán là các nghệ sĩ có thể coi ArtEmis như một công cụ hữu ích để đánh giá tác phẩm của mình trong suốt quá trình sáng tạo để đảm bảo công trình của họ sẽ khơi gợi được cảm xúc và có tác động như mong muốn. “Nó có thể đem lại hướng dẫn và khơi nguồn cảm hứng để ‘lèo lái’ tác phẩm của họ theo hướng họ mong muốn”, Achlioptas nói. Ví dụ, một nghệ sĩ đồ họa sáng tác một lô gô mới có thể sử dụng ArtEmis để đảm bảo là có được hiệu ứng cảm xúc mong muốn.

Một khi nghiên cứu và tinh chỉnh thêm thì Achlioptas có thể thấy trước các thuật toán về cảm xúc này có thể giúp mang đếm cảm xúc với những ứng dụng trí tuệ nhân tạo ở chatbot và các tác nhân AI đàm thoại. “Tôi thấy là ArtEmis có thể đem những hiểu biết sâu sắc về tâm lý con người vào trí tuệ nhân tạo”, Achlioptas nói. “Tôi muốn làm cho AI mang tính cá nhân hơn và cải thiện hơn những trải nghiệm của con người với nó”.

Tiasang (ctngoc)
Most viewed news

Apple Plans to Transform Siri into a Chatbot

Apple is reportedly preparing a major upgrade for iOS 27 and macOS 27, with a strong focus on AI-powered photo editing and a redesigned Siri that behaves more like a chatbot than ever before.

YouTube Tests New AI-Powered Q&A Search Mode

YouTube is experimenting with a new AI-driven search experience designed for users who often turn to the platform for recipes, travel planning, or step-by-step tutorials. Instead of simply returning a list of videos, the new tool allows users to ask direct questions and receive structured, step-by-step answers that blend text, short clips, and full-length videos.

Russian Engineers Double CNC Processing Speed with Breakthrough Machine Design

In a major leap for modern manufacturing, researchers at Izhevsk State Technical University (IzhGTU) named after M.T. Kalashnikov have developed a new method for operating CNC machining centers that doubles productivity without requiring expensive hardware upgrades.

Xiaomi’s Next-Gen XRING O3 Chip Leak Points to Foldable Phone Debut

Xiaomi is reportedly preparing to launch its self-developed XRING O3 processor, with leaks suggesting it will debut inside the upcoming Xiaomi 17 Fold. The new chip appears in Mi Code under the codename “lhasa”, hinting at a design optimized for multitasking on foldable devices.

Resolutely promoting digital transformation, developing science and technology, and reforming administrative procedures

The Government Office issued Notice No. 167/TB-VPCP concluding the second meeting in 2026 of the Government’s Steering Committee for the development of science, technology, innovation, digital transformation, and Project 06.

Scientific and technological autonomy: From accumulated foundations to value creation

Strategic autonomy in science and technology is no longer a distant goal but has become an urgent requirement as the accumulated foundation is now sufficient and the time for action has matured. With distinctive advantages such as rare earth resources, tropical forest ecosystems, abundant fisheries, and an important geostrategic position, Vietnam has a solid basis to develop and master technologies from its internal capacity, thereby creating differentiated and sustainable competitive advantages.

Nurturing high-quality technology human resources from P-Innovation 2026

On April 3, the Posts and Telecommunications Institute of Technology held the Final Round of the P-Innovation 2026 competition, aiming to promote the development of an innovation ecosystem within the university environment, associated with training high-quality human resources and developing technology products.

Guidelines for the dedicated data transmission network serving Party and State agencies

The Minister of Science and Technology has issued Circular No. 06/2026/TT-BKHCN stipulating details and providing guidance on several provisions of Decision No. 33/2025/QĐ-TTg dated 15 September 2025 of the Prime Minister on the Dedicated Data Transmission Network serving Party and State agencies.

The development of science, technology, and innovation becomes the main driver of economic growth.

Deputy Prime Minister Nguyen Chi Dung signed Decision No. 604/QD-TTg dated 02/4/2026 approving the adjustment and supplementation of the Strategy for the development of science, technology, and innovation to 2030 (the Strategy).

Related news
CAN THO CITY DEPARTMENT OF SCIENCE AND TECHNOLOGY

Copyright @ 2021 belongs to the Can Tho City Department of Science and Technology
Address: No. 02, Ly Thuong Kiet, Ninh Kieu Ward, Can Tho City
Phone: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Head of the Editorial Board: Mr. Tran Dong Phuong An - Deputy Director of the
Can Tho City Department of Science and Technology

Copyright © 2021 All rights reserved | This template is made by CASTI'1987