微信扫码
与创始人交个朋友
我要投稿
万知“股东大会”
wanzhi's shareholders meeting
Chief Experience Officer
万知首席体验官
李开复
转眼过了一周,作为万知的C"E"O(Chief Experience Officer,首席体验官)的我又来向各位万知的“精神股东”汇报上周工作啦。
上周伊始,我们就收到了一个令人振奋的消息。在 LMSYS 盲测竞技场最新排名中,零一万物的最新千亿参数模型 Yi-Large 总榜排名世界模型第 7,中国大模型中第一,已经超过 Llama-3-70B、Claude 3 Sonnet;在中文分榜上 Yi-Large 更是与 GPT-4o 并列世界第一。
由于 LMSYS Chatbot Arena 采用了号召千万真实用户盲测评分的形式,已经成为业内公认最客观公正、最接近用户实际应用场景的大模型评测平台。
目前,LMSYS 已经是 OpenAI、Google、Anthropic 等海外大厂旗舰模型“龙争虎斗”的当红擂台,像是 OpenAI CEO Sam Altman,Google DeepMind 首席科学家 Jeff Dean 都曾经引用 LMSYS 给出的排名成绩来佐证自家模型能力。
✦
✧
提示词魔法大揭密
✦
结合大家的反馈,我们了解到,与万知对话来获取各方面的知识是大多数人的诉求。与搜索引擎相比,毫无疑问,大模型能做到的事要多得多。它具备更自然的交互方式,能提供比搜索引擎更人性化的交互体验;同时得益于深度学习和语义理解,大模型也能够输出更准确、相关性更高的结果。
面对通识类问题,具备联网功能的万知都能对答如流。即便是诸如“iPad Pro比前作好吗?”这类极度口语化的问题,万知也能够理解“iPad Pro”是指“2024年款iPad Pro”、前作是“2023年款iPad Pro”,并且给出芯片、图形显示技术、内存等核心信息。
但是,如果能在提示词上做些优化,万知就会反馈给你更加详细、更具参考价值的答案。
在向大模型提问时,应当尽量避免使用模糊不清的词汇,比如“好”、“坏”、“怎么样”等,“请”、“麻烦你”这类礼貌用语也可以省略。尽可能使用目的明确的词汇,可以多次重复关键词“iPad Pro”。这样可以减少提问中的噪音,突出重点,便于万知理解你的真实意图。
如上述原问题中“比前作好吗?”就可以改为“我想了解iPad Pro产品的用户评价,与2023年款iPad Pro做个比较”。
同时,我们可以试着将复杂问题拆解为更简单的提示,分步骤提问,一步步引导万知理解你的问题。比如,在原问题的结尾加入“从性能、显示效果、价格、电池续航等角度分析”。
结合上面的小技巧,原问题就被改写为“我想了解iPad Pro产品的用户评价,与2023年款iPad Pro做个比较,可以从性能、显示效果、价格、电池续航等角度分析”。得出的内容与原回答也大不相同,不仅内容更加详实了,与2023年款iPad Pro的对比结果也更加明确了。
总结:
1、明确问题,尽量避免使用模糊不清的词汇,避免使用复杂的句式或过多的修饰语;
2、将复杂查询任务拆解为多步骤、更简单的提示,一步一步来;
3、在一个提示中可以多次重复重点单词或短语。
我们内部筛选出了一个badcase案例,结合上面的几点,让我们试试,一起把这个badcase转变成goodcase。
由于上述问题没有进行任何拆解,只是一个笼统的请求,万知所给出的回答内容也仅限于表面。同时,问题中没有重复任何关键词,没有突出重点,让人难以抓住问题的核心。
对比来看,这次万知的回答就细致深入了很多。修改之后的问题,直接指向了“最近流行的AI技术”,避免了模糊不清的词汇;同时笼统的问题也被拆解为三个更简单的小问题,分别是技术特点、应用场景和社会影响,便于万知逐一回答;在问题中多次使用“AI技术”这个词,强调了问题的重点。
如何写好万知提示词?
大模型在训练过程中学习了大量的文本数据,这些数据中包含了各种词汇和表达方式。
你可以将大模型视作在知识的海洋里畅游的一只书虫。当你给到大模型一个清晰的词汇时,就像是给了它一个清晰的航标,它能迅速地在记忆的海洋中找到正确的航道,准确地吐出你想要的答案。但如果给它一个模糊的词汇,就像是给它一个谜语,它可能会陷入深思,甚至开始胡思乱想,给出的答案可能就像是一首抽象派的诗,让人摸不着头脑。
为了让它不至于在知识的海洋里晕头转向,我们得用重点词汇给它指明方向。在自然语言处理中,词汇的出现频率可以被视为一种信号。多次强调重点词汇增强了这些词汇的信号强度,使得模型更容易注意到它们,并将其视为重要的线索来理解问题。
换言之,这些重点词汇对于大模型而言就是知识海洋中的灯塔,告诉它“这里要重点关注!”这样一来,它就能更快地捕捉到关键信息,避免在理解时出现误会。
至于为什么要将复杂任务拆分为多步骤,则是因为,在逐步处理简单任务的过程中,模型的每一步的输出都可以作为下一步的输入,从而形成一个连贯的上下文链,这有助于模型更好地理解整个任务的上下文和目标。
另一方面,在处理复杂任务时,模型的错误可能会在生成过程中累积,导致最终输出偏离预期。通过将任务拆解为多个简单的步骤,模型可以在每一步都进行校正,从而减少错误的累积,提高最终输出的准确性。
微故事征集大赛
很多人都把万知当作搜索引擎,但是其实它可以做很多有趣也很专业的事儿,它更可以当你的“AI特助”。前几天,我试着让万知用30个字写一个故事,要求写出惊悚的细节和完全想象不到的结局。结果它展现出的天马行空的想象力超出了我的预料。
我们的提示词课程也已经进行了两周,相信大家都总结出了自己的小技巧。所以,我决定向大家发出挑战书——30字微故事征集大赛!看看谁的故事更精彩!
登陆万知网页端(wanzhi.com)或进入“万知AI”微信小程序,编写专属于你的提示词,与万知一起创作出30字以内的精彩微故事。写出满意的微故事后,将你的微故事以视频评论、公众号评论及留言的形式发给我,就有机会获得签名版《AI未来进行式》及零一万物一周年限量版周边一份。
我们将选出十个优秀获奖选手,送出精美礼品,并于5月30日(本周四)《首席体验官周报》中展示获奖作品,期待你的参与!
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-05-28
2024-04-12
2024-04-25
2024-05-14
2024-08-13
2024-07-18
2024-05-06