随着 ChatGPT 横空出世、AI 行业蓬勃发展,初心尝试窥探 AI 领域的发展奥秘,2023 年 8 月正式发布《2023 初心 AI 趋势报告》,分享初心洞察 AI 未来发展的六大趋势,共同探寻通向智能极限的道路。
01 大模型创造力边界无限扩大,第四次工业革命到来
当今人工智能正在突飞猛进地发展,就像是无休止的探索之旅。ChatGPT 的火爆与其带起的一波创业与投资风潮绝不仅仅是因为它是一个可以聊天的智能机器人。现在的 AI 大模型不仅能够理解和思考,更以惊人的速度正在不断进化。想象一下,AI 正以超越人类想象的速度前进,就像计算机领域的"摩尔定律"。这个快速的进步,让 AI 能够创作文学、绘画,甚至涉足电影、游戏等领域。未来,我们还可能迎来一个虚拟世界的"元宇宙",其中 AI 创造的角色将赋予虚拟世界生命,与现实平行发展。
02 相比大模型,AI Agent 才是创业者的机会
AI Agent 在 LLM OS 时代的簇拥下应运而生,它基于 LLM 的通用推理能力实现规划能力、记忆能力、工具使用能力和执行能力的一体化。一些 “垂类 AI 模型” 其实应该被定义为 “垂类 AI Agent”,实质是在 LLM 基础上定义领域行为、解决领域问题。而构建 AI Agent 的关键也在于培养 Agent 的专业技能并提升用户交互体验,为 Agent 赋予特定领域所需的规划、记忆、执行策略等能力。截至目前,尽管许多 AI Agent 的 Demo 如订餐、英语教练已出现,但真正使用时仍有巨大改进空间。 这正是创业者的机会,通过深耕某行业,实现高品质 AI Agent,从而建立竞争壁垒。
03 Diffusion Model 控制力进化带来创造力升级
Diffusion Model 可以被视为一种创世演化模型——从一张空白的画布开始,通过随机取样产生毫无意义的噪点;然后根据模型内部设定的“控制规则”进行引导,这些噪点逐步演化成颜色、线条和纹理,进而形成最终的物体、人物、场景,甚至是完整的画面。 随着人工智能突飞猛进的发展,Text2Image 实现图片与文本的简单交互已不能满足需求,按风格、角色、结构、意图等实现文生图/图生图的更精准控制已经逐步被实现。其发展已经从静态到动态、二维到三维、高端 GPU 到人手一只的普通手机,Diffusion Model 的进化也将带来创造力的升级。在不久的将来,多模态混合将让 AI 能基于“理解”与“意义”创造,不仅学习图形,还能理解文本、语音、图像、视频,提升生成质量和控制能力,真正赋能人们的生产劳动过程。
04 涌现的 LLM Stack 与 No code/Low code 工具正在让 AI 平民化
借力 AI,并辅以其不断进化的代码创造力,越来越多的实用工具能够被轻而易举地创造出来。使用无代码 AI Agent 搭建工具,任何人都可以根据需求定制私人 AI 助手,为其赋予知识、技能和记忆。对于以上 AI 应用的畅想,绝不仅仅停留在 Demo 阶段,而是可用、有用且低成本的。依靠开源模型,人人都能享受 GPT4 技术,且无需理解复杂的 AI 算法即可进行个性化的模型设置。基于此,AI 工具也将进一步渗透进人们生活的方方面面,这亦是引领创业者走向前方的一盏明灯。
05 On-Divice AI 将成为未来应用的新基建
没有需求就没有市场,无论是 B 端还是 C 端,边缘 AI 都是追求效率和效果的共同诉求。然而,目前边缘计算的运算能力、存储和内存受到限制,模型压缩编译算法和模型芯片化将是未来的关注重点。未来,每个人都将像钢铁侠一样拥有一个个性化的超级智能管家 Jarvis。通过小型化的大语言模型与便携式的边缘 AI 交互窗口,人们能随时随地地与 AI 互动,感受到极高针对性的互动。智能技术将渗透方方面面,从手机到汽车、家居、机器人,甚至虚拟现实。在医疗领域,AI 结合传感器可以帮助诊断疾病并提供个性化治疗方案。同时,AI 还能在多领域挖掘集体智慧,解决复杂问题,推动科学进步。总之,未来 AI 将让我们的生活更智能便捷,创造无限可能。