引言

ChatGPT 从0到一百万用户只用了5天。
这个网站从0到一百万用户只用了11天。
它增长太快,服务器数次被冲击到宕机。上线不到一个月就遭受了严重的ddos攻击。甚至还遭到了 OpenAI 的疯狂封号。
这些都阻止不了真实的、强烈的用户需求。
这个网站就是 JanitorAI 。
本文将分析网站的定位、规划、产品和技术细节。
 
本文目录:
  • A16Z,AI 陪伴的疯狂增长
  • 产品定位,百无禁忌?
  • 终极目标,提供真实的AI男友/女友
  • 终极手段,训练自己的模型
  • 还有哪些比较有趣的地方?
 

A16Z,AI 陪伴的疯狂增长

 
6月22日,a16z的一篇长文《It’s Not a Computer, It’s a Companion!》中文版地址,介绍了几款AI角色平台,包括 Character.AI ,Chai,Janitor AI,Chub AI,Charstar,SpicyChat。
Character AI 久负盛名,是目前最大的AI角色平台,30人的小团队,拥有自己的LLM,并拥有超过一千万的AI角色。a16z 投资了1.5亿美金,目前估值10亿。
Chai 上线也很久了,用开源模型微调出了留存很高的对话模型,虽然用户数量不算太多,但靠着比 ChatGPT 高很多的付费率,目前已经做到盈亏平衡。
JanitorAI 则是在6月才刚刚上线,官方在7月10日宣布其获得了一百万用户只用了11天,到今天(7月15日)全站仅有4万个角色。
notion image
尽管 JanitorAI 号称是 NSFW(Not Safe For Work 不适宜工作场合使用) 里最奔放的,但同期 a16z 提到的 Chub AI、Charstar、SpicyChat 也都有多多少少的 NSFW 性质,但火爆程度确实天壤之别。所以不禁让人好奇,这个网站到底有什么特别?

产品定位,百无禁忌?

打开 https://www.janitorai.com/,会看到神奇的公告,告诉你这个网站需要自带 OpenAI 的 API key,并且随时可能被 OpenAI 封禁。
原本本来以为 OpenAI 的 API 是自由使用的,没想到还会被封禁。OpenAI说好的安全性、说好的人类对齐呢,最后还是只能靠封号😂。
notion image
网站首页最受欢迎的角色,全都是 NSFW,从角色的性别比例来看,本站的女性用户偏多,商业价值很高。
notion image
在一定数量的聊天后 OpenAI 会取代角色进行回复做出警告,可能是触发账号封禁的前兆。
notion image
虽然公告挺夸张,首页也很暴力,但官方确实有一些社区准则,并通过检测敏感词进行屏蔽。
notion image
另外从官方对用户协议和隐私政策态度来看,确实是个比较文化方面随意的公司。。
notion image
总的来看,官方对NSFW的宽容态度,让用户自带API,自己写设定的开放态度,以及对法规的随意态度,是很容易引起普通用户共鸣的,这和 ChatGPT、微软、谷歌所代表的公司风格相比,已经形成了差异化。
 

终极目标,通过技术实力提供真实的AI男友/女友

Janitor AI 官方说法是:the ultimate goal is an ai gf/bf that is real 最终目标是一个真实的人工智能男友/女友。
怎么理解真实呢,Janitor 是这样来做的:
  • NSFW 内容本身即是人类生活中真实存在的一部分,没有这部分的 AI 男友和 AI 女友必然是不完整的。(因此 ChatGPT 也永远无法成为和真人一样的 AI,只会成为阳光面的 AI。)
  • AI 角色不仅仅是聊天,还会进行暗示性的动作,和其他的陪伴类产品不同,Janitor AI 角色的动作部分内容更多,可以推动场景内故事的发展,进而通过微妙的互动细节增强情感体验。
  • 网站使用了多重 Prompt 结构,在没有对ChatGPT模型进行微调的情况下,就能做到让所有角色在回复中都会做出互动动作再进行对话,这种低成本高效果的实现显示出团队背后的技术实力。
  • 所有的互动和聊天,都通过类似 langchain 技术让角色进行持续的学习。互动和聊天越多,角色的真实感就越强。随着互动和聊天的深入,对用户打字的要求变得越来越低,举手投足之间,AI就能知道要做什么了。
notion image
在这些技术细节的加持下,Janitor 里角色的聊天体验具有超越 CAI 的真实感,这种真实感已经超越了游戏/动漫角色的扮演,更类似于人与人之间的以不同动作、语言产生不同互动的真实感。这种感觉很难描述,建议亲自聊一下试试。

终极手段,训练自己的模型 JanitorLLM

虽然官方做了很多工作,但是在 ChatGPT API 严格的封禁面前,真实男友女友的愿景都变得有些无力,所以官方也不得不做出自己的选择:训练自己的大语言模型。
从上面的分析可以看出,Janitor 的公司对大模型产品的技术链路理解都不是一般应用公司可以比的。
官方在6月15号就宣布已经在训练自己的 JanitorLLM,并表示这个模型不会内置任何审查。(大概率会把儿童色情等内容放到过滤词里)
目前网站上已经有信息表示 JanitorLLM 已经在进行 close beta,短短一个月就出来 beta,公司的技术实力可见一斑。
从用户需求的角度来看,人类对情感的诉求远远大于对知识的渴求。并且至少在 GPT4时代,AI在满足情感诉求方面的能力也远远超过了满足知识诉求的能力。而在情感陪伴AI的赛道,CAI 等网站对 NSFW 的态度并不算友好,这也是很多KOL迁移到 Janitor 的原因。
人类在本能趋势下疯狂输出内容,Janitor 则顺手用这些内容训练自己的模型。
人类自带了 OpenAI 的 API key,Janitor 则不花一分钱就拿到了这些数据。
这是一个由人类本能驱动的可怕的高速数据飞轮。
假如 JanitorLLM 做出了一个 NSFW 的模型,并且真的做到了没有审查,以现在公司的技术力和产品力,必将成为一个无法忽视的角色。

产品细节,有哪些比较有趣的地方?

这款产品有几点让人印象深刻的细节,可能是这些细节拉开了和其他产品之间的距离:
  1. 每个角色的设定都是公开可见的,用户可以找到化腐朽为神奇的prompt,随意copy、修改
  1. 每个角色都有一个打分评论区,大家可以为角色打分,或分享一些趣闻,这件事本身就很八卦有趣
  1. 网站的输入和AI回复是双向可编辑,又一个大型标注系统
  1. 人物设定里,包含几个重要的部分:
    1. personality,设定人物性格、外貌、行为、习惯等信息
    2. first message,人物的开场白,引导用户开始对话
    3. Scenario,场景,只有人物也是不容易开始的,在一个具体的情景中更容易发生故事
    4. Example Dialogs,示例对话,一般用于更精确地定义角色回复风格,以及一些特定偏好回答,或者作为场景的延伸。
    5. 因为现在阶段的AI有点类似记忆碎片,人们对一个新的AI的理解也是很浅薄的,所以从产品角度需要让用户尽快代入场景,开始对话和行动,非常类似P站视频的思路。
notion image
 
notion image
notion image
notion image