Mar 3, 2026

智泊AI直播笔记

大模型是一种基于深度学习的“超级大脑”，通过学习上千亿的海量文本、图像等数据，从而具备生成文本、回答问题、辅助决策等能力，微调可以让大模型快速具备处理垂直业务领域的能力

大模型微调训练

基于人类反馈的强化学习(RLHF)

大模型微调训练2

Agent：让大模型不止能思考，而且能行动。 研究一下：豆包 AI 手机

Agent

coze（扣子）：字节的低代码实现 agent 智能体。

coze

学到：仿真系统可以用来模拟 agent 数据。
理清楚：react plan and solve---通用思想
不懂 python:很多代码是用 AI 写的建议:花几小时研究一下 python 语法---变量列表—
建议:关注 4 块技术——提示词工程(规则)，rag(对应的文档),agent(更能像人一样干活),微调

mcp 是什么
答：mcp 是指模型的上下文参数，用于控制模型的生成行为。

学到：可以把 java、C++通过 HTTP 接口调用到 python 脚本中

agent share

提示词注入防御层级

在落地不同阶段会出现什么问题，解决思路

问题与解决

需求：既懂大模型又懂业务

skill