昨天做了一个视频,提示词中强调人物坐下后脱下自己的靴子,然后重新穿回去。结果生成后,角色是脱下左脚靴子,然后穿回到自己右脚。
开始觉得这AI实在是不靠谱。
后来我考虑到,AI犯错可能因为他对人物跟观众的视角出现了错乱。这就像小孩子小时候跟人面对面交流的时候,分不清自己和对方左右手一样。
又查看了一下AI的agent记录,果然,里面记录的是“观众视角的左侧是她的右脚,右侧是她的左脚。她弯腰抬起自己的右脚(观众视角左侧的脚)”。
一旦AI真正能代入角色,那就是一个大的阶段性进步。
但,那样可能也意味着AI的觉醒了。