智泊AI直播笔记


大模型是一种基于深度学习的“超级大脑”,通过学习上千亿的海量文本、图像等数据,从而具备生成文本、回答问题、辅助决策等能力,微调可以让大模型快速具备处理垂直业务领域的能力

大模型微调训练

基于人类反馈的强化学习(RLHF)

大模型微调训练2

Agent:让大模型不止能思考,而且能行动。 研究一下:豆包 AI 手机

Agent

coze(扣子):字节的低代码实现 agent 智能体。

coze

学到:仿真系统可以用来模拟 agent 数据。
理清楚:react plan and solve---通用思想
不懂 python:很多代码是用 AI 写的建议:花几小时研究一下 python 语法---变量 列表—
建议:关注 4 块技术——提示词工程(规则),rag(对应的文档),agent(更能像人一样干活),微调

mcp 是什么
答:mcp 是指模型的上下文参数,用于控制模型的生成行为。

学到:可以把 java、C++通过 HTTP 接口调用到 python 脚本中

agent share

提示词注入防御层级

提示词注入防御层级

在落地不同阶段会出现什么问题,解决思路

问题与解决

需求:既懂大模型又懂业务

skill