我的AI产品开发失败与学习的历史AITtomoki2025/5/21自从受到ChatGPT的冲击以来大约2年,我以个人或小团队的形式制作了一些产品。但是,所有这些在变现的意义上都失败了,结果以撤退告终。我将介绍其中的主要产品,以及当时的情况,并回顾一下为什么会撤退。 公开失败历史的原因是,希望能为同样在AI领域挑战的人们提供参考。此外,我也想通过这些经验,传达最终达成的当前产品“Evame”诞生的必然性。 过去制作的东西 AI代理 Autonomix (2023/02~04) 当时的情况 2023年2月,我成了LLM失业者。 第一次实际感受到LLM的可能性,是2021年6月发布的GitHub Copilot。最初只是非常局部的支持,但在2022年初左右,它已经进化到可以减少20%~30%的代码手动输入,即使是对机器学习不太了解的Web系工程师的我来说,也能明显感觉到未来。 我被LLM深深吸引,但当时LLM相关的招聘主要面向研究人员,Web系工程师很难加入。 然后,和许多人一样,在2022年11月,我确信ChatGPT的出现“改变了世界”。我向公司提出了LLM业务的提案,并与社长进行了大约1个月的讨论,但由于我的演示不够成熟,最终未能推动公司。 我决心自己制作产品,并于2023年2月向公司提出了辞职。当时LLM热潮还没有现在这么盛行,但在与X(Twitter)上热衷的一部分人深入交流的过程中,我感觉到AI代理今后将成为主流。 以“代替工作”的概念公开LP后,立刻有500人以上注册了候补名单,我感受到了明确的需求,于是开发了Autonomix。 产品概要 通过Zapier等API,自动执行聊天指示→邮件回复·SNS投稿等的AI代理。 撤退理由 这是AI产品常见的情况,虽然可以很快做出有魅力的原型,但从那以后,为了提高精度,需要花费无限的时间和成本,我陷入了这个沼泽。 具体的技术课题: 成功率仅为约80%,无法在实际业务中使用。 GPT-4的外部工具调用不稳定。重复重试和故障保护的结果是,逻辑变得肥大,多次LLM调用导致成本膨胀。仅仅发送一封邮件就需要花费3日元。 但是,存在更根本的问题。如果想要实现真正易于使用的UX,就应该直接在Gmail或Twitter等平台内运行。而且,Google和Twitter没有理由不提供此功能。 由于同时面临技术和战略上的课题,我判断“无法战胜Big Tech”,于是决定撤退。 Line Bot Talk酱 (2023/04~08) 当时的情况 在Autonomix失败后,我深刻体会到工具类软件的局限性。用创业公司常用的词来说,就是没有Moat(竞争优势)。归根结底,如果Google或Microsoft认真起来,就会免费提供同等或以上的功能。 因此,我改变了策略,寻找Big Tech难以进入的领域。那就是娱乐,特别是AI角色的领域。在这个领域,不是简单地投入资金就能做出好的东西,角色的魅力和与用户建立关系等,更人性化和更具创造性的要素变得重要。我认为在这里还有胜算。 AI角色主要有两种方法。一种是像Character.ai那样,让用户自己创建角色的平台型,另一种是由运营方准备有魅力的角色的内容型。我选择了后者。因为我想创造一个像哆啦A梦一样,鼓励用户并支持其成长的AI。 当时还没有RAG这个词,也没有具有长期记忆的AI。我认为如果应用至今为止掌握的技术,就可以实现长期记忆,并且由此构建的关系将成为Moat。于是我开发了Talk酱。 产品概要 拥有长期记忆的AI朋友。混合搜索保存在向量DB和图形DB中的对话数据,一边参考现在所说的RAG一边进行对话。 撤退理由 虽然也有几位付费用户,但没有达到可以作为事业继续下去的水平。根本性的问题有两个。 首先是成本问题。为了实现长期记忆,需要经常参照过去的对话数据,导致token消耗量巨大。为了实现盈利,需要设置每月3000日元左右的费用。 但是,我们没有提供足够可以证明该价格合理的价值。归根结底,即使有记忆,也只是“只能闲聊”的AI。我们没有创造出让人愿意每月支付3000日元也想使用的有魅力的体验。这是致命的。 也就是说,即使在技术上可以实现,也无法解决“高成本·低附加价值”的结构性问题,因此决定撤退。 应该设想一下正在制作的产品,实际上可以提供多少附加价值,也就是AVC(Accuracy Value Curve)。 参考文章 https://note.com/takahiroanno/n/ncb7d77bfd9f1 毛绒玩具AI (2023/08~10) 当時の状況 在Talk酱失败后,我思考了“有付费价值的AI角色”是什么。作为答案,我关注了身体的重要性。 不是简单的文本聊天,而是通过声音和身体,信息量会变得非常丰富。这样一来,用户应该会感受到与费用相符的价值。考虑到这一点,我决定开发可以对话并且可以表达动作的毛绒玩具AI。 产品概要 配备Wi‑Fi连接的毛绒玩具,内置麦克风、扬声器、马达,通过语音对话和滑稽的动作来治愈孤独感的设备。 撤退理由 在推进开发的过程中,我看到了硬件事业的现实。制造、品质管理、物流、客户支持...这是一个需要扎根10年才能に取り組む必要がある领域。 因此,我问自己。“我想把10年投入到这项事业中吗?” 答案是“NO”。理由很简单,我不认为这个产品是世界真正需要的东西。即使孤独的人与毛绒玩具对话,暂时得到治愈,那也只是对症疗法。 我自己也曾经因躁郁症等精神问题而痛苦。那时给我带来根本性解决的是,以毗婆舍那(Vipassana)为中心的冥想为中心的初期佛教智慧。毗婆舍那冥想是佛陀教导的实践方法,能让我们确信体验到开悟。我认为真正需要帮助孤独的人的是,以冥想为首的,支持内在成长的正确智慧,而不是转移注意力的玩具。 也就是说,产品·创始人·适配完全不匹配。我无法把自己从心底不相信其价值的东西上投入10年。因此,我判断并决定撤退。 回顾一下 现在想想,每个产品本身并没有什么不好。实际上,AI代理也有像Devin和Manus这样备受瞩目的产品,内容型AI角色也有像OzChat这样的成功案例。可能也有人被Lovot这样的宠物机器人所拯救。如果一直认真努力下去,或许也能取得相应的成果。 并不是这些产品不好,而是我自己觉得不是真正应该做的事情。 番外篇 - 其他实验性产品 在那之后,我在从事外包工作的同时,摸索自己真正想制作的东西,在不考虑变现的情况下,制作了一些实验性产品。 补助金选定AI 辞职后我才意识到,我完全不知道有失业保险等各种补贴制度。应该有很多人和我一样,所以我想如果有一个能引导用户了解合适制度的AI,应该会有用。 但是,在推进开发的过程中,我判断各种制度过于复杂,例外情况也很多,目前的LLM无法胜任,于是放弃了。 参考文章 https://note.com/tkgshn/n/n4fd785cf1381 翻译扩展功能 因为LLM比Google翻译能提供更自然的翻译,所以我想在浏览海外网站时使用LLM翻译,于是进行了开发。但是,如果翻译整个页面,API费用会很高昂,而且与Google翻译相比非常慢,实际使用时UX很差。 佛教AI 仏教AI 仏教AI pali-canon-chatbot.vercel.app 以佛典的经藏为数据源的聊天机器人。如果直接问AI,初期佛教的教义和大乘佛教的教义会混在一起,给出矛盾的回答,所以通过限定数据源,使其只根据初期佛教的教义进行解答。 现在正在制作的东西 - Evame 现在的状况 除此之外,我还大量尝试过只需一周左右就能完成的东西。通过这些经验,我意识到,我只能认真对待自己从心底相信有价值的东西。而且,我认为真正有价值的是,有助于人们根本幸福的东西。 例如,大幅削减生活成本的机制,将学习游戏化的应用,以及将以毗婆舍那冥想为首的佛教智慧传达给现代的东西。 Evame的构想 在不断摸索的过程中,我开始考虑制作与毗婆舍那冥想相关的产品。 最初我打算制作一个教导毗婆舍那冥想的AI,但后来又觉得这非常困难。因为冥想的指导需要根据个人的情况进行细致的应对,而且学习者和指导者之间不可或缺的是深厚的信任关系。 因此,我决定全文免费公开佛陀教义的现代语翻译。 佛典(三藏)是收录了佛教根本教义的珍贵文献,但目前可用的全文日语翻译是战前和战中的版本,没有现代语的完整翻译。而且,免费公开的也有限。 我认为如果构建一个利用LLM的翻译系统,并创建一个用户可以进行翻译评价和改进提案的机制,就可以产生比以往更优秀的译文。 现在的愿景 在以佛典翻译为核心的同时,由于我也想广泛分享世界各地的知识和故事,所以我考虑公开世界各地的公共领域文本。但是,数据库的成本变得巨大,免费公开是不现实的。 因此,我整理了方针,在继续免费公开包括佛典在内的公共领域文本的同时,为了实现可持续运营,我还将增加用户可以投稿文章的博客平台功能。 那就是现在这篇文章所在的这个网站,Evame。 用户只需在这里撰写文章,就可以自动生成多语言翻译,并将自己的话语传达给全世界。 而且,可以使用自动提高翻译质量的机制。例如,将这篇文章的显示语言设置为日语以外的语言,然后点击显示的译文。应该会出现投票和追加的UI。 现在免费会员最多可以撰写2种语言的文章,但付费会员最多可以对应4种语言等,我们将通过充实面向付费会员的服务来实现变现。现在虽然还没有实装付费会员功能,但将来计划以这样的模式运营。 我想把Evame打造成全球版的note,成为超越Medium的世界第一的博客社区网站。 也就是说,Evame是一个同时提供“免费公开佛典等公共领域内容”和“多语言博客平台”的平台。前者提供社会价值,后者实现可持续运营。通过这种组合,我认为可以长期向世界持续传递有价值的信息。 即使变现不顺利,只要能继续下去,我就会继续开发。因为我确信这是世界所需要的。 总结 通过至今为止的失败,我学到的最重要的是,如果不是自己从心底相信其价值的东西,就无法长期坚持下去。 技术上的可行性和市场的需求也很重要,但更重要的是,对于开发者来说,是否实现了“产品·创始人·适配”是决定性的。 关于Evame,我将在另一篇文章中更详细地介绍,请务必试着写一篇文章。 请多多关照!!!14410ZHCommentslogin and startStartpost
智基/Tomoki@tomolld·FollowAIを搭載したぬいぐるみ作ったWatch on X1:06 AM · Jul 26, 202316ReplyCopy linkRead 3 replies