Skip to content

什么是智能体

2023年11月9日,比尔盖茨先生发布了《人工智能即将彻底改变你使用计算机的方式》文章,里面详尽阐明了Agent(智能体)这个颠覆当前人与计算机交互方式的概念。在个人助理、卫生保健、教育、生产率、娱乐购物、科技等领域给出了非常多的畅想,实际上在更早的时间,首届OpenAI DevDay更是以实际的行动展示了Agent理念的落地摸样,个人仅通过自然语言聊天的方式就可以创建一个复合型的GPT应用,可以作为自己的个人助理也能够对外部提供服务,GPTS的生态也在快速的繁荣,然而今天对于个人开发者和企业而言,要构建Agent依然有着不小的技术挑战,哪怕是目前技术很成熟的知识库类的Agent,在构建文本向量化能力,RAG(增强检索)技术, 以及页面富交互,Agent能力交付和效果优化,内容安全等方面也有非常多的工作量要做。 本篇文章尝试从系统化的角度看待构建Agent的问题,并将这些问题进行整合抽象,提炼成平台化的共性能力。

是什么?

指能自主感知环境并采取行动实现目标的智能体。基于大语言模型(LLM)的 AI Agent 利用 LLM 进行记忆检索、决策推理和行动顺序选择等。

image

更直观的可以理解为 Agent是具备理解自然语义并且进行实际行动和过程思考,最终完成人类指定任务的程序。

有什么价值?

因其具备了理解自然语义以及进行实际行动和缜密推导的类人化能力,使得受常规逻辑限制的应用程序具备了更多的可能。

比如你可以一句话要求智能体帮助完成订餐,购物,旅行规划等任务;

比如你可以通过简单对话就能获取特性领域的知识;

比如你可以通过设定任务,直接获得大量资讯简化总结后的内容。

对整个人类社会而言,都有非常大的促进作用

具体的交付物是什么

可以是具体的完整应用,比如数字人+领域知识构建的数字导购Agent;也可以是一个或者一组API服务被集成到已有的业务中, 《构建函数助手》《定制儿童绘本智能助手》 两篇文章详细的介绍了智能体的构建交付和测试效果

如何构建智能体

  • 使用类似langchain 这种编程框架,其内置了Agent的方案,您通过调用LLM服务和编写执行工具进行编程实现,然后构建交互以及部署发布
  • 基于类似AgentCraft 这样的智能体平台搭建编排快速获得

以上两种方式均有各自的优劣,可以根据自身需要进行选择