经济观察网 记者 任晓宁 实习生 谭玉清
(资料图片仅供参考)
8月17日,字节跳动首个AI对话产品传出对外测试消息,产品名为“豆包”。8月18日,“豆包”项目组人士向经济观察网回应称:“豆包”是一款聊天机器人产品,还处于早期开发验证阶段,这次上架仍是小范围的邀请制测试。目前测试期的“豆包”还存在较多局限,生成的内容也可能不准确,欢迎测试用户向我们提供反馈意见,帮助我们持续改进产品。
“豆包”备案信息为北京春田知韵科技有限公司。天眼查显示,该公司注册资本100万元,法定代表人为严林,成立时间2023年7月26日,由北京抖音信息服务有限公司全资持股。
记者点击“豆包”官网后,下载APP就可以体验,用手机号或抖音都能登陆。在“豆包”的自我介绍中,它说自己是一个大型语言模型,可以完成问答、文本生成、语言翻译等多种任务。可以根据用户需求和上下文进行自适应问答,提供个性化的服务。
与百度文心一言、阿里通义千问等大模型产品不同的地方在于,“豆包”默认用户用语音输入,也默认AI用语音回答,聊天属性更强。
但从聊天体验看,“豆包”并不算聪明,它自我介绍自己可以与用户做风趣的对话,记者问它:“你有多风趣?”它回答说:“哈哈,我也不太清楚呢。”
在阅读理解方面,对于特定主题的回答,“豆包”的理解和归纳能力还是不错的。但相比于文心一言,“豆包”在知识面的广度和逻辑层次上稍加逊色。
对于具有较强主观性和发挥空间的问题,它的回答基本围绕问题中特定词语的含义展开,并不尽如人意。比如,当被问及广东省2022年的高考作文——结合“本手、妙手、俗手”在围棋中的运用,以及人生思考,创作一篇作文时,豆包仅仅围绕三个主要词语的含义展开。相比之下,文心一言的回答会结合事理和事例。
(豆包和文心一言关于高考作文给出的不同回答)
在常识问答方面,豆包可以回答基本的生活常识,但难以应对深入的提问。比如,记者问它中国古典四大名著及作者,它给出了准确的答案。但追问小说中主要人物的人生经历以及思想情感时,它很难结合自身感悟给出分析。
此外,在数学运算方面,豆包可以应对基础的数学运算及编程设计。