AI AI 讲座实验室 for non-CS students

讲座对象:非 AI / 非计算机专业

把 AI 讲成 每个人都能用的 工作伙伴

这不是技术课,而是一场“建立判断力”的讲座:知道 AI 能做什么、为什么会出错、怎样把它放进学习、表达、创作和任务执行里。

Structure

三段式讲法

每个模块都配一段现场演示,观众会先看到现象,再得到概念,最后拿到可以继续使用的工具。

先建立模型直觉

用“上下文背包”和“逐词生成”解释大模型,而不是从神经网络公式讲起。

再翻译行业黑话

把术语变成普通人能用的判断:什么时候要 RAG,什么时候要 Agent,什么时候只是 prompt。

最后带走工具地图

按任务选择工具,而不是按热度追应用:搜索、写作、图片、视频、自动化各有位置。

Module 1

AI 基础知识

这一页先建立“模型直觉”:AI 大模型不是会思考的人,也不是万能数据库,而是一套在上下文中生成内容的系统。

模型权重 上下文 工具 你看到的 AI 软件
01

模型不是资料库

训练把大量模式写进参数;回答时不是翻书查原文,而是根据当前上下文生成最可能的下一段内容。

02

上下文决定本轮表现

同一个模型,看到的历史消息、文件、规则和工具不同,答案就会不同。下一页会拆开看这个“上下文包”。

03

会犯错不是偶然

模型擅长生成“像合理的表达”,但不天然保证事实正确;需要资料、引用、工具和人的判断来校准。

语言模型

处理文字 token,适合总结、改写、规划和问答;弱点是可能把“像真的”说成事实。

图片模型

根据文字、参考图或局部修改生成视觉结果;适合海报、草图和风格探索。

视频模型

在时间维度里生成画面、动作和镜头;适合分镜预演,但长时一致性仍要人工把关。

训练完的那一刻,模型本身不会自动变聪明

关键区分:模型权重 vs 产品上下文
训练前 收集资料、清洗数据、学习语言和世界模式
训练完成 基础能力被写进权重
产品使用 提示词、联网、工具、记忆、文件进入上下文

“AI 记得我”通常是产品把信息带进来了

比如你说“我喜欢网页式讲解”,系统会在下一次对话前把这条偏好加入上下文。模型没有重新训练,只是本轮看到了更多材料。

Module 1 · Live lab

两个现场小实验:亲手当一次“模型”

不用公式。玩过这两个实验,“AI 到底在做什么”就有画面了。

实验 1 · 逐词接龙

AI 一次只想一个词

大模型不整段思考:每一步都在算“下一个词最可能是什么”。你来替它点,或者让它自己抽。

正在生成的句子

点右侧候选词,替模型做一次决定;或点“让模型抽一个”看它按概率抽签。

下一个词的候选与概率

概率来自训练时学到的语言模式。抽签有随机性,所以同一个问题每次回答可能不一样。

实验 2 · Token

文字在模型眼里长什么样

模型不按“字”读,而按 token(小碎片)读和写。随便输入一句话,看看它被切成什么样。

0 tokens 0 个字符 不同模型切法不同,这里是示意
上下文窗口有多大?(一次能读进去的 token 上限)
8K≈ 一次课的讲义
128K≈ 一整本教材
1M≈ 一个小书架

窗口装满后,最早的内容会被摘要或丢弃——这就是长对话会“忘事”的原因,下一页模拟器会演示。

Context window simulator

表面只发一句话,实际发送的是完整提示词包

这页专门用来讲清楚:AI 软件为什么“好像记得你”,以及每一轮对话如何把历史、记忆、工具和系统规则重新装进上下文窗口。

Story view

每一轮,软件都在重新装一个包裹

第一轮主要装入系统规则、工具说明和当前消息。
软件手里的材料(不只是你打的那句话)
本轮请求包 34.3k tokens
大模型 读完整个包,逐词生成回答
模型的回答 · 基于整个包,而不只是最后一句

Prompt inspector

完整提示词查看器

本轮真实请求包
Context window 上下文窗口
34.3k / 1.0M (3%) 已装入上下文
本轮一起带给模型

第一轮主要包含系统规则、可用工具说明和当前消息。

完整请求包 7 个分区

                    

Module 2 · 黑话点菜单

把 AI 术语做成一桌菜

行业黑话听着玄,其实都能在一家餐厅里找到对应角色。点一道菜,收银机会给你打一张“说人话”的小票。

🧑 你 = 顾客 负责说清楚想吃什么
💁 AI 软件 = 前厅 记桌号、写小票、递材料、喊帮手
👨‍🍳 大模型 = 主厨 只看小票做菜,出师后手艺不再变

Market map · 2026

主流厂商与模型生态

不做“谁最强”排行榜,而是让学生知道:国际三巨头、国产第一梯队和创作工具链各自的入口在哪里。

OpenAI / ChatGPT

通用对话与复杂推理的代名词,GPT 系列 + Sora 视频,全球用户量最大的入口。

Anthropic / Claude

长文档理解、写作分析与编程协作见长,Claude Code 与 Agent、Skills、MCP 生态的发源地。

Google / Gemini

搜索 + Workspace + 安卓入口,Gemini 多模态、Veo 视频、NotebookLM 学习工具。

字节 / 豆包 · 即梦

国内月活第一(3.4 亿+)的国民级入口,豆包主对话,即梦管图像视频,抖音生态联动。

阿里 / 千问 · 通义

2026 年增长最快的国产应用,Qwen 系列同时是全球最主流的开源模型之一。

DeepSeek / Kimi / 腾讯元宝

DeepSeek 以开源推理出圈;Kimi 擅长长文档;元宝背靠微信生态。中文场景各有侧重。

开放权重阵营

Llama、Qwen、DeepSeek、Mistral 等可下载部署——解释“为什么有的模型能装进自己电脑”。

创作工具链

Midjourney、即梦、可灵、Runway、Veo、Suno:图像、视频、音乐生成更像创意工具,而非聊天。

xAI / Grok 与其他

Grok 绑定 X 平台;Meta AI 内嵌社交应用。讲清“模型—产品—入口”三层就不会被新名字吓到。

Module 3

常用 AI 软件工具超市

按任务选工具:先确定要完成什么,再决定打开哪个软件。

Why tools

模型的知识停在训练那天,工具把“现在”带给它

权重在训练结束时就冻结了:它不知道今天几号,也没看过昨晚的新闻。所以真正的 AI 软件会给模型配工具——先查证,再回答。现场试一试同一个问题的两种命运。

裸模型 · 只有权重 今天是几月几号?
同一个模型 · 带工具 今天是几月几号?

What is an agent

Agent:从“回答问题”升级到“完成任务”

聊天机器人像问路——它告诉你该怎么走;Agent 像代驾——你说目的地,它自己开过去。给一个目标,它会自己拆步骤、调工具、检查结果、发现错误自己改,做完才回来找你。

三个信号,说明你面对的是 Agent
  • 1动手前先列计划,而不是直接给答案
  • 2中途会自己调用工具查证、读文件、做事情
  • 3出了错自己发现、自己重做,不用你盯着
同一句话交给普通聊天 AI

一段建议,回答完就结束了——执行还是你自己来。
你只说一句
理解任务 制定计划 调用工具 观察结果 修正并输出

注意第 5 步:它自己发现了问题、自己改掉了——这就是 Agent 和普通聊天最大的区别。

Module 4 · Vibe coding

没学过编程,也能让 AI 帮你写出第一个作品

2026 年的编程入门方式变了:你负责说清楚“要什么”,AI 负责写代码,你负责看效果、提修改。这个网页本身就是这样做出来的。

1

用一句话描述需求

“帮我做一个倒计时网页,考研倒计时,页面要简洁好看。”不用术语,说人话就行。

2

AI 生成完整代码

工具会直接给出能运行的网页/脚本,很多平台还能实时预览,不用配置环境。

3

看效果,继续对话改

“数字再大一点”“换成蓝色”“加一句鼓励的话”——每次反馈都是一次迭代。

4

发布分享

一键部署成真实网址,发给同学。从想法到上线,第一次可以只花 20 分钟。

Take home

今天记住三句话就够了

  1. AI 是概率接龙,不是百科全书。 它擅长生成“像合理”的内容——重要的事实、数字、引用,自己再核对一遍。
  2. “记忆”只是每轮被带入的上下文。 模型训练完就冻结了;新对话会失忆,重要背景要自己再提供。
  3. 先想清楚任务,再挑工具。 把 AI 当实习生:交代清楚目标、材料和格式,别把最终判断也外包出去。