從零到生產6~9個月,學到什麼,跳過什麼,為什麼大多數教程都失敗了。 從零到生產6~9個月,學到什麼,跳過什麼,為什麼大多數教程都失敗了。 我会对你诚实的。 大多数AI代理教程都是垃圾。 他们向你展示了如何复制和粘贴LangChain代码,构建一个演示,在你尝试任何真实的时刻打破,让你觉得你学到了什么。 我看过人们这样浪费多年,追逐框架,收集证书,构建玩具项目,没有人关心。 这个指南是不同的。 我会告诉你每个阶段需要多长时间,在继续前看起来“足够好”是什么样子.你需要的每一个资源都在这里。 你正在阅读的是很多试验和错误的结果,找出当学习代理人工智能时有什么重要 这是我的承诺:如果你认真地遵循这个路线图6至9个月,你将能够构建和部署在现实世界工作的人工智能代理,而不是演示系统解决问题。 你会得到什么: 从零到部署代理的8个阶段(具有现实的时间表) 哪些资源真的值得你的时间 导致真正就业的专业化道路 继续前看“足够好”是什么样子 我犯的错误,所以你不必 但是你必须去做这项工作,不要滑雪,不要为以后写书,不要告诉自己,你最终会得到数学。 如果是你,我们去吧。 为什么代理AI现在很重要 传统的AI是反应性的,输入,输出,你问一个问题,你得到一个答案。 代理AI追求目标. 它查看其环境,制定计划,采取行动,看到发生了什么,并调整它可以使用工具,调用API,搜索网络,编写代码,并与其他代理人一起完成事情。 这里有一个具体的例子。 请传统的人工智能帮助您研究竞争对手,它将总结它已经知道的内容。 询问一个代理系统,它将搜索网络,查找你的竞争对手最近的动作,提取他们的新闻稿和资助公告,分析他们的定位,与行业报告交叉参考,写一份战略简报,将其保存到你的驱动器,并在完成时向你发送电子邮件。 这就是为什么公司想要能够构建这些系统的人。到2026年,代理商将不再令人印象深刻 - 他们将被期待。 路线图 这里是完整的图片,在我们进入细节之前: 第一阶段:数学 4–6 weeks 你想跳过它,我知道。 但是,如果没有线性算法、计算和概率,你就不会明白你的代理人为什么会做他们所做的,你会复制运作的代码,直到它运作,然后你就不知道如何修复它。 你不需要成为一名数学家,你需要在三个领域工作流利。 线性算法:矢量,矩阵,eigenvalues,SVD。神经网络是矩阵数学。 计算衍生品,梯度,优化.这就是模型学习的方式。 概率和统计 - 贝耶斯的理论,分布,假设测试. 代理在不确定性下理性。 资源 Linear Algebra: 3Blue1Brown:线性算法的本质 线性算法的最佳视觉解释 格兰特·桑德森有使抽象概念感觉直观的天赋。 Khan Academy Linear Algebra. 更传统,更全面. 适合在3Blue1Brown之后填补空白。 机器学习基础:欢迎来到旅程. 专为ML设计,所以你正在学习数学有目的。 用于机器学习的数学. 另一个专注于ML的选项. 选择任何类型为您点击。 3Blue1Brown:线性算法的本质 哈恩学院线性算法 机器学习基础:欢迎来到旅程 机器学习的数学 Calculus: 计算机学习的计算器. 目标和实用. 跳过你不需要的东西。 漢學院計算 1. 經典. 徹底和可靠。 计算1完整的大学课程. 如果你想没有学费的完整的大学经验。 计算机学习 哈恩学院计算器 1 计算1 全校课程 Probability: 哈恩学院统计和概率. 涵盖你需要的一切在一个良好的速度。 StatQuest 统计基础 Josh Starmer 解释统计数据就像他正在和一个朋友说话一样。 StatQuest:Bayes的理论.Bayes在AI中到处都是。 MIT OpenCourseWare: 概率的介绍. 大学级的严谨性,如果你想深入。 哈恩学院统计和概率 基本统计数据 标签: 贝耶斯理论 MIT OpenCourseWare:概率的介绍 Textbook: 数学机器学习 — 免费PDF. 综合参考. 密集但完整. 当你需要寻找某些东西时,有好处。 免费PDF 何时移动 你可以解释矩阵倍增在地理上所做的事情,你可以用手计算梯度,你可以用一个例子来解释贝伊斯定理,你不需要掌握。 阶段二:编程 3–4 weeks Python,没有其他选择。 但是,知道Python语法并不等于舒适地写代码,你需要能够读取别人的代码而不挣扎,写自己的代码而不经常在谷歌中使用,并在事情发生错误时进行调试。 您还需要图书馆来处理数据。 核心 Python 功能,类,装饰,错误处理,async. 你需要所有这些。 学习Python:初学者的完整课程. 4+小时,涵盖一切. 如果你从零开始,很好。 Python Crash 课程初学者. 速度更快. 如果你已经编程了其他语言更好。 学习 Python the Hard Way (教科书) 老学校的方法:通过键入代码学习,直到它粘贴。 学习Python:初学者的完整课程 初学者的Python Crash课程 数据图书馆 NumPy 用于数组和数值计算,其他一切都建立在基础之上。 Pandas 用于数据操纵,您将每天使用此功能。 Matplotlib & Seaborn 用于可视化. 你不能调试你看不到的东西。 资源: 使用Python进行数据分析(NumPy,Pandas,Matplotlib,Seaborn)。 NumPy,Matplotlib和Pandas教程由伯恩德·克莱恩. 书面格式与良好的深度。 使用Python进行数据分析(NumPy、Pandas、Matplotlib、Seaborn) NumPy,Matplotlib和潘达教程由伯恩德·克莱恩 选项:R 如果你来自统计学或想要研究角色,R是有用的,否则跳过它。 R 在一个小时内编程. 正如它听起来一样。 R for Data Science (免费在线)。 最终的R书. 哈德利·威克汉姆知道他在做什么。 一个小时的R编程 免费在线 何时移动 您可以从头开始编写脚本,而不寻找基本语法. 您可以加载 CSV,清理数据,运行一些分析,并绘制结果. 当您看到NumPy代码时,您可以理解它正在做什么。 第三阶段:机器学习 6–8 weeks 这就是人们永远被困的地方。 他们随时观看课程,从不感到准备好继续前进,不要这样做,目标不是成为ML研究员,而是了解主要方法,足以知道哪个适合哪个问题。 三种类型 监督学习. 你展示了正确答案的模型示例,它学习了模式。 了解算法:线性回归,物流回归,决策树,SVM,k-最接近的邻居,神经网络。 何时使用它:分类,预测,任何你已经标记的数据。 未经监督的学习. 模型在数据中找到模式,而没有被告知要寻找什么。 了解算法: k-means 集群,层次性集群,DBSCAN,PCA. 何时使用它:组合相似的东西,减少尺寸,找到结构。 强化学习. 代理人采取行动,获得奖励或处罚,并从经验中学习。 认识的概念:状态,行动,奖励,政策,Q-learning。 使用时:序列决策,游戏,机器人,规划。 这对代理人来说非常重要。 资源 The main course: 机器学习专业化 由Andrew Ng. 这是一个. Ng是该领域最好的老师. 清晰的解释,良好的步伐,涵盖了重要的东西。 同样的课程在YouTube上,如果你只是想学习没有证书。 机器学习专业化 由Andrew Ng 同样的路径在YouTube上 Other options: 机器学习对于每个人来说都更容易获得,如果 Ng觉得太学术了。 Kaggle:引进机器学习. 短,实用,让你快速建造. 良好的补充。 Edureka:机器学习完整的课程. 如果 Ng 的风格不适合你,全面的替代方案。 Fast.ai 实用深度学习. 向上向下的方法:开始建设,根据需要学习理论。 机器学习为每个人 Kaggle:机器学习的介绍 爱德鲁卡:机器学习全程课程 Fast.ai 深度学习 For practice: Scikit - 学习教程. 实施你正在学习的东西. 没有代码的理论是无用的。 学习教程 何时移动 您可以解释监督与未经监督的反对强化学习,并举例说明您何时使用每个模型,您已经训练了一个模型,并可以解释指标的含义。 第四阶段:代理人如何工作 4–6 weeks 代理人有记忆力,使用工具,并计划前进,这与聊天机器人不同。 了解这些部分是将能够粘贴API的人与能够设计支持系统的人分开的。 基本路径 每个代理人都会做一些版本: 获取信息(用户输入、搜索结果、API响应)。 原因?处理它,弄清楚什么是重要的。 计划:决定要做什么 Do it (call a tool, generate text, hit an API). Act. 看看发生了什么,调整一下。 您需要的概念 Memory: 短期:当前背景窗口中的内容 长期:矢量数据库,存储的知识 剧情:记录过去的互动 Reasoning patterns: 思维链:逐步思考 思维之树:探索多种途径 反应:在推理和行动之间交替 Tool use: 代理人如何调用外部工具 如何应对失败 编辑多种工具 Planning: 将目标分成步骤 搜索算法(A*等) 层次性规划 Multi-agent systems: 多名代理人合作 他们如何沟通 专业化 资源 Concepts: . Good starting point. Covers the landscape without getting too technical. AI代理和代理AI的力量解释 AI 代理人在 5 个难度级别中。 开始简单,变得复杂. 每个级别的完整代码. 很棒地看到代理的复杂度如何。 建立你的第一个AI代理的完整指南. 手动路径. 很好,如果你想今天建立一些东西。 AI代理和代理AI的力量解释 AI Agents in 5 Levels of Difficulty 构建你的第一个AI代理的完整指南 Reinforcement learning (important for agents): 拥抱面部深度RL课程. 很棒和免费. 这就是代理人如何学会随着时间的推移做出决策。 在 GitHub 上编辑的 RL 资源. 如果你想深入,大规模收藏。 Hugging Face 深度 RL 课程 在GitHub上编辑的RL资源 何时移动 You can draw the agent loop on a whiteboard and explain each part. You can describe different memory architectures. You understand ReAct and why it works. 第五阶段:构建框架 6–8 weeks 现在你正在建设。 有一件事要记住:框架变化。LangChain现在占主导地位;两年后,谁知道?但是模式(ReAct,Plan-and-Execute,Multi-agent)仍然存在。 Patterns 代理人思考要做什么,做什么,观察结果,重新思考。 计划和执行 代理先制定一个完整的计划,然后逐步执行,更适合复杂的多步任务。 多代理商 多家专门代理商合作 一个研究,一个写作,一个评论。 框架 LangChain / LangGraph. 当前的标准。LangChain对于简单的东西,LangGraph当你需要复杂的状态管理时。 AutoGen. 微软的多代理框架. 当代理人需要进行反向讨论时非常好。 更高层次的多代理管弦乐队,更快的原型,更不灵活。 资源 Courses: DeepLearning.AI:代理AI.Andrew Ng教学代理设计模式. 涵盖反思,工具使用,规划和多代理。 免费和值得你的时间。 Master ALL 20 代理 AI 设计模式. 涵盖您将不断使用的模式。 DeepLearning.AI:代理AI Master ALL 20 Agentic AI Design Patterns LangChain: LangChain Crash Course. 快速开始. 让你在一个下午建造。 LangChain Mastery: 完整的5小时课程. 深潜水. 观看当你准备好认真的时候。 LangChain文件. 真理的源头. 你会住在这里。 LangGraph docs. 对于当你的代理人需要真正的国家管理时。 长链崩溃赛道 LangChain Mastery:完整的5小时课程 长链DOCS 长篇文本 Docs Multi-agent: Simplilearn:如何构建一个多代理系统. 实用步骤. 适合您的第一个多代理项目。 Simplilearn:如何构建一个多代理系统 When to move on 你已经构建了至少三个代理:一个简单的ReAct代理,一些RAG和一个多步工作流。 第六步:选择专业化 8–12 weeks, then ongoing 在某个时候,你需要深入一个领域,一般人可以谈论代理人,专家被雇用来建造他们。 选择其中一个,并承诺至少3个月,然后决定它不适合你。 路径A:业务自动化 目前最大的市场. 处理研究、支持、运营的代理人. 实际预算,实际工作。 What to focus on: RAG(Retrieval-Augmented Generation) - 教学代理人寻找和使用知识。 API 集成:将代理人连接到企业已经使用的工具。 多步工作流程. 复杂的流程,包括操作和错误处理。 人类在循环模式.知道何时升级到一个人。 Projects to build: 根据背景编写响应的电子邮件助理 竞争对手研究代理监控新闻并总结变化 客户支持机器人知道什么时候脱离其深度 来自多个数据源的报告生成器 方法B:机器人 更高的障碍,更少的竞争.在物理世界中运作的代理人。 What to focus on: ROS (Robot Operating System). The standard for robotics software. 机器人怎么看?机器人怎么看? 机器人如何导航?机器人如何导航 模拟:测试而不破坏昂贵的硬件。 Resources: 引入自主机器人. 该领域的坚实起点。 机器人和自主系统杂志. 学术,但有用的是看到什么是尖端。 PyBullet用于物理模拟,Gazebo用于机器人环境,OpenAI Gym用于RL训练环节。 Introduction to Autonomous Robotics Robotics and Autonomous Systems journal 子 Gazebo 的 开设健身房 Path C: Research & Model Development Fewer jobs, higher ceiling. This is for people who want to work on the models themselves, not just use them. What to focus on: 精细调整LLM与LoRA和PEFT,在特定任务上更好地制作模型。 RLHF和奖励建模. 培训模型来自人类反馈。 评估和基准测量:测量什么实际上有效。 阅读和执行文件. 留在边境。 Projects to build: Fine-tune 一个特定域的模型 构建代理输出的评估管道 从零执行最近的一篇论文 贡献一个开源模型 Resources: . The reference for working with models. Hugging Face Transformers docs . How to train models from human preferences. RLHF 赛程 arXiv AI 论文和 ML 论文. 新的想法首先出现的地方。 Hugging Face 变形器 Docs RLHF 赛程 档案 论文 ML 文件 第七阶段:部署 3–4 weeks 你的代理人在笔记本中工作,然后用户会发送你没有预料到的输入,整个东西就会崩溃。 大多数自学的人跳过了这个部分,这就是为什么学习它使你脱颖而出的原因。 你需要什么 API. 将您的代理作为服务曝光. FastAPI 是标准。 容器. 包装一切,以便它在任何地方都运行相同。 选择 AWS、GCP 或 Azure,并学习一个。 监控. 跟踪你的代理人在生产中做什么. 你会惊讶于它有多频繁地表现不当。 成本管理. LLM调用快速增加. 缓存,模型选择,快速效率所有事项。 资源 Overview: 在生产中部署代理人工智能. 部署涉及什么的大图像。 为什么大多数AI代理人在生产中失败?从其他人的错误中学习 涵盖常见的失败模式以及如何避免它们。 超越原型:十五个难得的教训. 来自航运代理人的真实教训. 在部署之前阅读这篇文章。 在生产中部署代理AI 为什么大多数AI代理人在生产中失败 超越原型:十五个难以获取的教训 Hands-on: 使用Docker、FastAPI、LangChain构建和部署人工智能代理,从代码到部署服务。 FastAPI docs. 写得很好的 docs. 您可以从其中学习FastAPI。 Docker for Beginners. 容器不再是可选的。 Build and Deploy AI Agents with Docker, FastAPI, LangChain 快速的DOCS Docker 对于初学者 Cloud: 使用 Amazon Bedrock 部署 AI Agent. AWS 特定的但显示了管理服务方法。 . Reference for when you’re actually doing it. AWS Bedrock 代理文件 使用 Amazon Bedrock 部署 AI 代理 AWS Bedrock 代理文件 Monitoring: LangSmith. 专门为 LangChain 设计,向您展示您的代理正在做什么。 重量和偏见. 更一般的ML跟踪. 如果你正在做定制培训,很好。 兰斯密斯 Weights & Biases 何时移动 You’ve deployed one agent end-to-end. Containerized, served via API, running in the cloud, with some monitoring. You can explain your setup and why you made the choices you did. 第8阶段:投资组合和保持现状 Ongoing 这个领域的变化很快,今天的新东西是六个月的标准,你需要习惯,而不是一次性学习,如果你不连续学习,你会落后。 你的钱包 Your portfolio is proof you can build. Not certificates. Proof. What makes it strong: 部署项目. 运行系统,不仅仅是 repos. 任何人都可以将代码推到 GitHub。 真正的問題解決了,不是教程的娛樂,你真正需要的東西或解決了真正的痛苦。 经典的决定,你为什么这样建造它,你做什么交易。 清洁代码. 显示你可以在团队中工作。 目标为2~3个固体项目,至少一个部署和可访问。 (一)贡献 没有什么能像合并的公关公司那样表现出竞争力。对LangChain、AutoGen或较小的项目做出贡献。 (二)保持现状 Set aside a few hours a week for this. Where to look: 趋势论文. 看看研究界目前正在关注什么。 OpenAI:深度RL中的关键论文. 编制的基础论文列表. 良好的深度建设。 趋势论文 OpenAI:深度RL中的关键论文 Who to follow: Andrej Karpathy.他的YouTube教程清楚地解释了复杂的事情。 Jim Fan. 關於體現的 AI 和代理人的文章。 Lilian Weng. 她的博客文章比大多数课程更好。 西蒙·威利森. 不断与LLM建立,分享什么工作。 Swyx. 追踪人工智能工程中实际有用的内容。 Anthropic的研究博客:边界模型实际上是如何工作的。 安德烈·卡帕蒂 吉姆·法恩 莉莉安·温 西蒙·威利森 斯维克斯 Anthropic的研究博客 这就是它 这是你所需要的一切。 不是所有的存在,总是有更多的,但你需要的一切从零到构建生产代理。 有一些事情要记住当你去: 每一个阶段都应该包括项目,观看和阅读不是学习,建设就是学习。 混乱是正常的,如果你从来没有感到困惑,你就没有足够的努力,不适意味着你正在学习。 教你学习的东西. 博客帖子,视频,向他人解释. 这就是你如何发现你真正理解的。 寻找人. Discord 服务器,会议,LinkedIn. 单独学习更难和更孤独。 耐心!6~9個月是現實的,有些星期你會覺得很棒,有些星期你會感到困擾,兩者都是正常的,繼續前進。 那些“想学习AI代理人”和实际构建它们的人之间存在的差距只有一件事:开始。 没有完美的开始,没有完美的设置,刚刚开始。 六个月后,你可能有一个部署的代理人组合,公司支付的真正技能,以及实际构建事物的信心,或者你仍然可以收集标记,等待合适的时刻。 现在是合适的时刻,这个领域是年轻的,机会是真实的,你在这里拥有你所需要的一切。 滚动到第 1 阶段: 打开第 1 个资源,今天开始。 问题?问题?留下评论