【AI入门】AI 小白工具入门教程:从聊天、出图到视频创作
AI 工具可以先按用途分成四类:语言大模型、图片生成、视频生成、AI 聚合/工作流平台。
内容预览
教程内容
AI 工具可以先按用途分成四类:语言大模型、图片生成、视频生成、AI 聚合/工作流平台。
小白不用一开始就研究模型参数,先学会“入口在哪里、适合做什么、怎么提问、怎么迭代”就够了。
需要先分清三个概念:
模型是背后的能力,比如 GPT Image 2.0、Seedream(即梦生图)、Veo;
产品入口是你实际打开使用的地方,比如 ChatGPT、Gemini、豆包、即梦;
聚合平台是把多个模型、素材、画布、工作流放到一起的平台,比如 Lovart、TapNow、FlowPix、LibTV。
一、语言大模型:先学会“问问题”和“让 AI 帮你干活”
各家大语言模型各有各的特点与优势,主要的功能差不多(不过国外的模型都明显强于豆包)。
1. ChatGPT网页端入口:
(chatgpt.com)
ChatGPT界面
适合做什么:
写文案、改文章、总结资料、翻译、做表格、头脑风暴、学习辅导、代码解释、方案策划,同时可做生成式 AI 创作(生成图片提示词、视频脚本、分镜、内容选题、商业创意方案)
基础用法:
不要只说“帮我写一篇文章”,而是说清楚身份、目标、受众、格式和风格。
2. Gemini入口:
Gemini 官网
(gemini.google)
Gemini界面
适合做什么:
搜索式问答、资料整理、英文内容处理、图片理解、图像和视频生成入口,同时可做生成式 AI 创作,例如提示词生成、视频脚本和分镜设计。
Gemini的会员有个好处,一个会员就可以享受绝大部分谷歌的其他AI平台
例如:
2.1 Flow(https://labs.google/fx/tools/flow/)
Google 的 AI 视频与图片创作平台,开通pro会员后可以接近无限的使用Nano banana模型,以及1个月10条veo3.1视频。
Flow界面
2.2 NotebookLM(https://notebooklm.google/)
NotebookLM 是 Google 的 AI 笔记和资料研究工具,适合上传文档、生成总结、问答、学习笔记、音频概览和视频概览。
2.3 Google AI Studio
这是偏开发者的平台,可以用来测试 Gemini 模型、做原型、调用 Gemini API、体验 Nano Banana Pro 和 Gemini Pro 模型。
3. 豆包
入口: