来源:环球网
【环球网科技综合报道】5月18日消息,据外媒LiveScience报道,尽管人工智能(AI)在编程、图像生成、文本创作等领域展现出接近甚至超越人类的能力,但在处理日常生活中基础的“看钟表读时”“推算日期”等任务时,却频繁出现错误。这一现象揭示了当前AI技术在复杂场景理解与常识推理方面的局限性,引发科技界对AI落地应用能力的反思。
报道指出,当前主流AI模型(如GPT-4、Stable Diffusion等)已能在以下场景展现卓越能力:
编程与代码生成:GitHub Copilot等工具可自动补全代码,效率较人类提升40%;
艺术创作:Midjourney等AI绘画工具能生成媲美专业画师的作品;
文本生成:ChatGPT可撰写学术论文、营销文案,甚至通过部分标准化考试(如美国律师资格考试)。
然而,在看似简单的日常生活任务中,AI却屡屡“翻车”:比如部分AI模型无法准确识别模拟钟表的指针位置,将“3:15”误判为“9:45”;在推算“今天是周三,100天后是周几”这类问题时,错误率高达30%;面对“如何用鸡蛋、面粉和烤箱制作蛋糕”等基础生活技能,AI给出的步骤常存在逻辑漏洞。
专家分析,AI在基础任务上的失误源于两大核心缺陷:
视觉-空间理解能力不足:模拟钟表需要AI同时处理指针形状、角度、数字刻度等多模态信息,而现有模型(如CLIP)在三维空间推理上仍存在缺陷;对比实验显示,人类识别钟表时间平均耗时0.8秒,而AI模型需耗时2-3秒且准确率仅75%。
时间序列与常识推理缺失:日期计算涉及闰年、月份天数变化等复杂规则,AI缺乏对“常识时间”的建模能力;例如,当被问及“上周一的日期”时,部分模型会忽略当前日期动态变化,直接套用固定模板导致错误。
麻省理工学院计算机科学教授Josh Tenenbaum指出:“当前AI的‘智力’更多体现在模式匹配而非真正理解。要让AI融入日常生活,必须教会它们像人类一样感知空间、理解时间。”(青山)