发布网友 发布时间:2024-10-19 19:24
共1个回答
热心网友 时间:2024-10-24 07:45
揭秘人工智能视觉局限:图像识别挑战人类感知
在最新的研究中,来自HSE大学和莫斯科理工大学的专家揭示了人工智能在图像识别领域的不足。他们发现,AI模型由于与人类视觉生理学的脱节,无法完全复制人类视觉特征,这在识别图像时造成了显著差距,这一发现发表在了国际信息和通信技术大会的论文集中。
科学家们通过实验,将经典的视觉错觉图像上传至IBM Watson Visual Recognition服务,其中包括隐藏在背景中的几何形状。结果显示,AI在虚构图形识别上的表现令人惊讶地差,只能准确识别彩色三角形,而这主要得益于其与背景的鲜明对比。HSE计算机科学学院的大数据分析方法实验室分析师Vladimir Vinnikov解释道:“现实生活中的某些场景,如自动驾驶车辆识别拖车或仅由灯光指示的无线电塔,与我们实验中的错觉图像有相似之处。”
生理差异揭示机器视觉局限
人类视觉的奥秘在于眼球的动态扫描和半球形视网膜,能通过不断移动和想象力填补细节。相比之下,AI的光电系统结构限制了它们处理矢量图像和错觉的能力,只能识别已知的物理描绘。这就意味着,当面对低对比度的背景物体时,机器的识别精度可能大打折扣,潜在威胁到安全,如自动驾驶系统可能无法及时避障。
然而,科学家们并未放弃提升AI图像识别的可能。他们提出,模仿眼球运动的生理机制,让机器能够处理二维和三维场景,或是在图像描述中加入矢量信息,将有助于改进机器的识别精度。Vinnikov强调:“在设计依赖照片和视频的自动化系统时,如汽车或无人机的自动驾驶,想象中的物体识别是必不可少的测试,以降低潜在风险,确保工业和交通领域的安全。”
尽管AI在图像识别上尚有局限,但通过不断的研究和技术创新,我们有望逐步缩小与人类感知的差距,推动智能系统更全面、准确地理解和应对复杂的世界。