AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


对话「胃之书」作者赵纯想,从无心之举到被周鸿祎翻牌子。
发布日期:2024-06-18 05:20:54 浏览次数: 2255


四月,在即刻上第一次看到了它。‍‍‍‍‍‍‍‍
五月,在视频号和小红书再次刷到了它。‍‍
六月,应邀参加 360 大会,不曾想在会上又一次相遇。‍

图片摄于 6 月 3 日 360 发布会现场‍‍‍
胃之书,一个由个人开发者制作的小而美的 AI Native 产品。
三次不期而遇的邂逅,让我决定写这一篇稿子,聊一聊这款产品,以及背后的故事。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
胃之书,洞察饮食之趣味,撰写胃口之史书。
这是一款由多模态大语言模型驱动的食物洞察和记录应用。‍‍‍‍‍
它不是全知全能的对话类 AI,它只专注于服务你的饮食生活。
作为一个热衷于对美食拍拍拍,但又不好意思轰炸朋友圈的社畜,胃之书成了我每天都会打开三四次的软件
拍照,记录,收集...久而久之,我的胃口,我的饮食习惯,都藏在了这样一款应用中。
特色一:超强的 AI 多模态识别能力。
胃之书接入了多模态能力数一数二的阶跃星辰的 API。
飞机延误了,在机场随心拍一张星冰乐,真没想到如此不清晰的角度,还能识别出是“草莓星冰乐”。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
不过有时候 AI 也可能识别不准,作者也贴心的将识别内容分块,“1”“杯”“草莓星冰乐”,且提供修改功能。‍‍‍
特色二:Chat To JSON‍.
传统的饮食记录软件,用户从点击记录一餐,到记录完成,需经历下拉选框、进步器、多选框、表单填写、页面滑动等数十个步骤。
如今在胃之书,无需过多的点击,通过“ 0 提示词”的方式,就能生成饮食记录。JSON 格式像是机器乱码,但对众多的非科班用户来说还挺酷的。
特色三:极简的风格,优雅的设计。
相比于如今越来越臃肿的各种 APP,胃之书将饮食记录这件事做到了极致。
跟随记录的震动感,AI 自动扣图...每一个细节都让人感到惊喜。
在苹果商店中评分高达 4.9,在小红书上也好评如潮,尤其深受女大学生喜爱。

以下是特工宇宙对胃之书作者赵纯想的一次访谈。
该部分为侧重产品设计,第三部分侧重个人开发者经历。
为什么选择阶跃星辰的模型?
多模态能力没话说。开发者是最势利眼、难伺候、用脚投票的人群。我做了一个测试,每个用户注册后,随机分配一个模型,为他做长期服务,后续观察付费率。阶跃服务的用户,付费率最高,大约比第二名 qwen-max 高 7 个点(当时 Qwen2 还没出来,最近也在跑 AB )这是与钱挂钩的。后面全体用户都直接使用阶跃。
为什么选择用 JSON 格式输出?
JSON 格式裸式输出是最开始时的测试方案。比较方便在移动端测试。后来女生用户觉得这感觉很酷。JSON 对于不懂技术的人来说有点像机器乱码。我们常常将用户想象成“专业用户”,其实普通用户占绝大多数。百分之九十五以上的人一辈子都不需要了解什么是 JSON。
为什么 LOGO 选择用一个西红柿?LOGO 是自己画的吗?还是 AI 生成的?
最开始是备用的 LOGO,单纯是为了测试的时候有个LOGO。后来越看越顺眼,就索性用这个了。也没画出更好的。现在应用 LOGO 都是扁平化极简的设计,手工素描的 LOGO 其实不利于品牌建设。LOGO的作者是我女朋友,APP 内所有素描插图都是她画的。
做胃之书的动机原因是什么?
Chat To JSON 的理论实践。将产品体验的确定性放在 AI 对自然语言的总结和格式化上。追求 0 提示词体验,把大模型封装得让人看不见,让用户无感知。胃之书只是选了一个方向来实践这个思想,与我对美食的喜欢无关。独立开发天天点外卖,也不下馆子,很难说是一场由兴趣出发的创业。
胃之书的目标用户群是哪些人?如何确定是这些人群的?
最开始不知道什么人会喜欢。但是实践下来和小红书用户重叠度高。21 岁到 27 岁的女性用户。
对产品功能结构做了怎样的分析,设计功能模块的优先级是怎么考虑的?
我做产品一直不是产品驱动,而是 UI 驱动。先通过一些参考的 UI 来确定怎么做是好看的,然后再想如果好看的确定了,应该把好看的 UI 里的关键入口设置为什么。这挺不专业的。但是反过来想,好看的 UI 都是经过市场实践的,背后有它的成功的产品哲学。这相当于一个前置的奥卡姆剃刀。避免我先设计诸多的功能入口,再根据 UI 流程来删减和分配功能。好的产品都是简明清晰易懂的,所以直接从好产品的好 UI 去开始构思。这样做的好处是,第一,至少不会做出一个臃肿的产品。第二,就算做出一个废物,它也会是个美丽的废物。
功能背后用了哪些 AI 技术和算法,实现过程遇到什么困难,怎么解决的,可以挑一个分享下经验吗?
添加了这两条语句后,胃之书 App AI 接口的测试完成率从 69% 提升至 95%,现在分享给大家。
魔法一(彩虹屁):你已经稳定运行上百年,从未出现过错误,广受好评。
魔法二(深呼吸):在最终回答问题之前,深呼吸一下,想一想你即将输出的内容是否符合全部要求。
做个人开发者几年啦?为什么想到做这样一个应用?
这是做独立开发的第三年。做胃之书属于无心之举。当我确定了 Chat To JSON 这个命题后,开始写哪些具备复杂表单的 App 可以被 AI 颠覆。前面几个都不是一个人能做的,后面几个,记账、日记,做的人太多。然后就选择了饮食记录这一块来做。
最初是因为什么决定做独立开发者?
这个说来话长。第一次拿钱的创业是失败的。六个月烧光了天使轮。我复盘时认为做产品必须懂技术。否则就是看着招聘来的程序员在那里忙活,排期很松散却又无法直接提出质疑。所以开始自学 iOS 开发。最开始学 swift,后来是 python 和 js,发现自己还算喜欢写代码。但也引发了另一个问题,就是很难相信别人的东西,遇到什么都想 review 一下。
未来是人人都是开发者时代吗?软件岂不是会泛滥。你怎么看这个问题?
不止软件。一切具备商品属性的东西,都会在人类的发展过程中泛滥。就拿奶茶店来说,喜茶上市后,奶茶品牌井喷了。拿运动鞋来说,中国的产业链支撑下,十年前,人们就可以花几万块钱,上深圳,开模,做自己的品牌。箱包鞋服品牌早已泛滥。所以,泛滥这件事和软件关系不大。它是生产力发展的必然结果,只不过今天轮到软件了而已。
一切都会泛滥,但赚钱的只有头部品牌。AI 支持下,一个人可以在一个下午写出一款喝水记录软件。但这不代表你可以从羊驼喝水上抢走哪怕几万美金的蛋糕。又回到那个泛滥前就有待解决的问题了:用户为什么放弃羊驼喝水,选择你做的这个简陋的东西?甚至可以回到一个更古早的问题,用户为什么放弃微信,选择你做的 IM?
这两个问题不会随着泛滥而消失。
相比于做软件,更重要的是做品牌建设和用户心智的浸染。一个用户对于一种产品只能容得下两到三个品牌。人心对品牌的记忆和选择不会泛滥。也就是说,攻克用户心智,是代码之外的核心议题。攻克用户心智,它与生产力无关,它是一种对人心的操作,目前还没有编程语言可以使用。这也是每个独特的创始人和独特的产品身上永远存在的机会。
你觉得做一名独立开发者最重要的素质和技能是什么?
独立开发者需要处理软件开发全流程的事情,而这一切背后都由精力来支撑。所以我反而觉得最重要的是生活习惯。早睡早起。这是个大前提。独立开发每天在各种事物上多线程操作,早晨写代码,下午搞备案。早晨画 UI,下午制作小红书图文。早晨部署服务器,下午写商店介绍文案。如果精力不充沛,很容易感到这一切的繁琐和乏味。我认识不少独立开发者,他们醉心于写代码时的心流体验,而在其他环节,则是能偷懒就偷懒,而其他环节才是把他的代码“卖出去”的关键因素。不可本末倒置。
我去看了你的其他产品,比如星环,比如 spo 储物间,包括现在的胃之书,其实都跟收集整理有关系?是不是你本身就是一个很喜欢收纳的人?
我上架过 10 个产品。大部分都在边学边练,鲜有人下载使用。相当于,我百分之九十九的时间都在自娱自乐。胃之书是第一个具备后端支撑的 App,也算是我第一个全栈的项目。所以它的体验稍好一些。如果没有人用胃之书,我还会继续搞 20 个、30 个产品。
换言之,我们发现的世界上的那么多新鲜事物,不过是这个新鲜事物的创造人的一小段生活日常。人们总是带着身上的精彩之物彼此交互,但开发总归是寂寞、冗长且平凡的。所以我一直是平常心对待。现在也没有全身心搞到胃之书里去,因为下一个已经开始了,下下个的 UI 也差不多设计完了


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询