智东西(公众号:zhidxcom)
作者 | 吴菲凝
编辑 | 李水青
说到AIGC工具,你还是只知道ChatGPT?
实际上,越来越多的AIGC应用都已经不是基于OpenAI的GPT。在文娱领域,歌手”AI孙燕姿”、”AI周杰伦”的翻唱音乐爆火,让歌手本人都叹服;在电商领域,AI虚拟人724小时念着AI生成的台本,为企业卖出百万货物;在特殊的课堂上,虚拟教师根据语音内容输出手语课程,助聋哑人学习知识……这些场景,都成为企业自研大模型或开源模型的落地领域。
据智东西统计,截至5月中旬,全球至少有百款具有代表性的AIGC工具落地应用。从日常办公到社交媒体,从游戏制作到平面设计,从金融法规到产品销售,AIGC工具的角色定位从以往的”观察 预判”升级为如今的”生成 决策”,推动AIGC落地”奇点”初显。
▲词云图展示了围绕ChatGPT,其他使用率、提及率较高的AIGC工具
在文本写作领域,以ChatGPT、文心一言等对话聊天式机器人为首的AIGC工具节省了人们检索信息的时间成本,以对话的方式就能完成一系列低效重复性工作,其他写作类工具还包括Notion AI、腾讯文涌、WPS智能写作等。
在图像生成领域,AIGC也颠覆并重塑了以往的绘图方式,”以文生图”为创作者提供了风格迥异、源源不断的灵感来源,在设计领域已掀起一场生产力革命。比如Midjourney、DALL-E等工具,不断扩展人们想象力的边界。
在音视频领域,AI通过对海量源数据进行分析,能按照预设风格生成音频、视频,既缩短了创作周期,也突破了物理空间和时间的限制。常用工具包括讯飞听见、MusicLM、Runway Gen-2等。
除以上应用场景之外,还有更为细分的协同办公、语言学习、电商直播、编程、数字人虚拟偶像等场景,都能借助于AIGC技术,从技术层面以低边际成本、高效率的方式满足用户的个性化需求。
更值得一提的是,在钓鱼信息不断涌现、虚假新闻充斥版面的当下,为了将AIGC内容与真实内容区分开来,网易、人民网相继推出了AIGC内容检测工具来对内容风险加以控制。国外也有AIGC内容检测相关工具,如专攻文本抄袭检测Copyleaks、论文查重助手DetectGPT等。
本文分别从七大板块解读了100余款AIGC工具,并附网页链接,帮助使用者提高工作生产力。实际上,国内外的AIGC工具每天都如雨后春笋般出现,因此本文收录的100款AIGC工具并未完全覆盖产业,但求在类别和方向上为产业提供一定参考。
一、AIGC写作工具:一键写作,生活or办公场景都适配
文本生成是AIGC最先实现商业落地的技术之一,也是AIGC发展至今最成熟的一项技术。如今,AI写作工具无论是在上下文的理解能力、对常识性知识的抓取能力、对长篇幅文本的生成能力,还是在生成内容的完整性、准确性、逻辑性上都有了质的飞跃。
AI写作工具现在主要的落地场景可以大致分为以下三类:
一是应用型文本生成,如据意查句、反向词典等,有较为明确的功能使用场景,使用指向性也较为明确。二是创作型文本生成,如Notion AI、WPS智能写作等,可以用于文本续写、内容生成等,大多为非结构化写作,用户有更大的文本创作空间和自由度。三是对话型文本生成,如文心一言、通义千问、讯飞星火等,具备高交互性的同时对大模型的自然语言理解能力要求也更高。
1、Notion AI:用ChatGPT帮文本”美颜”
Notion AI是一款写作助手,主要功能包括写作、编辑、总结等,可以自动生成博客文章、会议日程、社交媒体文案、新闻稿、销售邮件以及诗歌等满足不同场景需求的文字内容。用户可以让Notion AI处理某篇文章的初稿,借其获得更多的写作思路;或是将它当作一个编辑器,检查拼写、语法、翻译上的错误。
该工具目前采取”免费试用 付费”模式,为每位新用户提供20次免费试用机会,次数使用完后则需要购买服务,价格为10美元/人/月,折合约68.9元。
网页链接:
https://www.notion.so/product/ai
2、百度文心一言:最懂中文的”AI段子手”
文心一言是百度开发的一款聊天机器人,主要功能包括与用户对话互动、回答问题、协助创作等,帮助用户获取信息、知识和创作灵感,使用场景包括有文学创作、商业文案写作、数理推算、中文解释、多模态生成等。
文心一言的优势除了文案生成之外,还包括图片创作能力、根据文案自动生成视频的能力等。
https://yiyan.baidu.com/welcome
3、阿里通义千问:写情书都不在话下
通义千问是阿里云自研大模型,目前搭载了9种应用,主要分为效率类、生活类和娱乐类。
(1)效率类,包括写提纲、SWOT分析、商品描述生成三种应用;
(2)生活类,包括”会放飞的菜谱”、”小学生作文”、”然后呢”三种应用;
(3)娱乐类,包括”彩虹屁专家”、”写情书”和”为你写诗”三种应用。
目前,通义千问主要功能包括文案创作、对话聊天、知识问答、逻辑推理、代码编写、文本摘要以及图像视频理解服务。
https://tongyi.aliyun.com/
4、讯飞星火:7大维度能力,表现不输ChatGPT
讯飞星火是科大讯飞在5月6日推出的一款大模型,具备文本生成、语言理解、知识问答、逻辑推理、数学、代码、多模态这七大维度能力,经测评对比发现其在语言理解和数学能力上的表现已经优于ChatGPT。
讯飞星火可以完成多风格、多语言、多任务的长文本生成,还能对英文文案进行语法检测和纠错,在语言理解能力上不输国内可测的现有系统。
https://xinghuo.xfyun.cn/?ch=360tg-xh-cy01
5、序列猴子:一只能回答复杂问题的AI猴子
AI公司出门问问推出的大语言模型”序列猴子”,其能力体系以语言为核心,涵盖”知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。
序列猴子已经有了一定的自然语言理解、知识、逻辑以及推理等能力,对于”湖南和湖北哪一个省会的人口更多?””天猫背后的公司的创始人本科毕业于哪个学校?”等这类需要进一步思考的问题,它已经能够快速给出准确结果。
openapi.mobvoi.com
6、腾讯文涌Effidit:一款无线续写的论文写作神器
文涌Effidit(Efficient and Intelligent Editing)是由腾讯AI Lab研发的智能写作助手,利用AI技术来辅助写作者发散思路、丰富表达,并提升文本编辑和写作的效率,所具备的功能包括有智能纠错、文本补全、文本改写、文本扩写、词语推荐、句子推荐、生成等功能。
https://effidit.qq.com/
7、据意查句WantQuotes:名人名言百科全书
据意查句是清华大学研究团队研发的一款文案处理工具,利用最前沿的AI和自然语言处理(NLP)技术,帮助人们更加方便、快捷地处理阅读、写作、文案搜索、查找名人名言等。
用户只用输入相关主题词汇,它就能找出相关的名言、诗句、俗语、成语等。
https://wantquotes.net/
8、反向词典WantWord:同义词近义词宝典,告别词不达意
反向词典和据意查句同属清华研究团队研发,能通过已给出词语能帮助找到的更加贴切、生动的近义词,还支持中英双语同译和互译。
https://wantwords.net/
9、息流FlowUS AI:网盘 备忘录 写作助手
息流是一款专注于为小型组织和个人提供服务的知识管理和协同办公软件,将写作文档、知识存储、多维表格、思维导图等多种功能集成到一个平台上,其用户以高校学生群体为主,占比超过总用户人数的1/3。
息流与目前也已与ChatGPT进行了适配,用户可以使用FlowUS AI来根据自身需求实现写作、续写、翻译、润色等功能。
https://flowus.cn/product
10、WPS智能写作:1秒自动生成各类文章
WPS智能写作是金山办公推出的一款帮助用户高效创作的智能写作产品,主要包括四大功能:文本自动生成、辅助初稿写作、句子智能补写、文本智能校对。
其文本数据和相关信息来源于权威媒体和政府公开网站,题材覆盖讲话、总结、计划、新闻等多种写作场景,并与金山文档打通,可实现文本云端同步上传,用户在线写作后可以转到金山文档进行更加专业的排版等文档编辑。
https://aiwrite.wps.cn/#/
11、GrammarlyGo:在线语法”捉虫师”
英文拼写检查工具Grammarly也推出了AI服务GrammarlyGo,它可以根据用户输入的关键词提示来生成邮件草稿,或是帮现有文章更换语气与文字风格、调整文章的长度等,并为主题写作起草大纲。
https://app.grammarly.com/
12、火山写作WritingGo:翻译润色一键到位
火山写作是字节跳动推出的一款写作助手,目前已支持全文润色的AI智能写作服务,无论是修改论文、润色简历,还是写留学申请文书、撰写自媒体文案等20多种写作场景,火山写作都能覆盖。
用户输入想要润色、修改的文本内容,点击”一键优化”之后,它就能自动识别文本类型、风格以及写作目的,用户还能调整想要修改的幅度,平台就能基于原文一键输出英文改写结果,还支持智能纠错、多样改写等AI功能,使语言表达更加地道、简洁。
https://www.writingo.net
13、知士问答:智能问答机器人
知士问答是一款基于AI技术的智能问答系统,用户可以在知士问答平台上输入问题,系统会自动分析问题并给出最佳答案。同时,它也提供了多种交互方式,包括文字输入、语音输入等,以满足不同用户的需求。
http://zhimachat.com/
除了以上这些较为熟悉的AIGC写作工具外,还有不少”冷门产品”有待用户体验,如Friday AI写作助手、爱改写、Claude、创作王、秘塔写作猫、Subtxt、Writesonic等等。
二、AIGC图像工具:文生图不止Midjourney,一键实现绘画自由
2022年可以说是”AI绘画元年”,多款AI作画工具在文字提示的帮助下展示出了良好的图像理解与生成能力。
在GPT-4的助力之下,”文生图”领域也掀起了新一波竞赛浪潮。更迭到V5版本的Midjourney凭借一组情侣写真火爆全网,设计行业龙头Adobe也不甘落后,火速推出”萤火虫(Adobe Firefly)”来一较高低,其一键修图、分层修改等功能造福了广大设计工作者。如今的AI图像工具无论在商业化还是艺术化上较之去年都更为成熟、风格也更为多变。
▲一组由Midjourney自动生成的复古情侣写真
图像工具的技术场景可分为图像生成、图像局部修改、图像编辑这三种。
一是图像生成。以Midjourney、Stable Diffusion、DALL-E 2等为代表的产品主要聚焦于从端到端的图像生成,能基于一段文本描述或是草图生成一张具有指定风格的完整图像,底层技术逻辑明确,能为创作者提供一定的灵感来源与创作参考。
二是图像编辑。主要功能包括有图片智能去水印、设置风格滤镜、修改图像风格或是提升图片清晰度等,以Imagen AI、创客贴AI画匠等产品为代表。
三是图像局部修改,代表产品为Adobe Firefly。它的主要优势聚焦于更改图像的部分要素,或是按照图层来逐层修改调整,适合于二次创作或是后期的作品完善环节。
1、Disco Diffusion:用嘴就能画画
Disco Diffusion是一个运行在谷歌云端电脑(Google Colab)上的作图程序,拥有谷歌账号的用户可以直接在浏览器上运行,但需要用户掌握一定的代码知识。
用户通过输入一段描述语句,该程序就能自动渲染生成对应场景的图片,它更擅长生成风格偏梦境感的抽象画面,在写实风格的具象生成和输入较多文本描述时效果一般。
https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
2、Midjourney:AI”摄影师”
Midjourney是由Disco Diffusion的作者之一推出的一款AI绘画聊天机器人,搭载在Discord上。在GPT-4推出之后,它也快速更迭到了V5版本。新版本在图像的逼真度、细节处理上更加精细,商业化水准更高,近乎达到了可以”以假乱真”的地步。
之前的版本中,生成图片的风格多以卡通或是超现实为主,少有写实风格的图片,更新到V5版本之后的Midjourney凭借一组真假难辨的情侣写真迅速出圈,已经达到了电影的质感,在手部特写、眼部特写、光影处理方面更加逼真。
此外,Midjourney