2025 03 25, 2131 今日內容
2025-03-25, 21:31-今日內容
今天学会了lora 和自己config的modgpt2 的customed model去训练wikitext的数据。 还看到gpu… tokenizer 是“单独把每句话变成数字” curl -LO https://github.com/neovim/neovim/releases/download/v0.10.0… 原来casual是原因结果的意思。 很久没有用blog了。 现在回来看看
🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️下一個筆記🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️
今天学会了lora 和自己config的modgpt2 的customed model去训练wikitext的数据。 还看到gpu… 今天学会了lora 和自己config的modgpt2 的customed model去训练wikitext的数据。 还看到gpu充分的呗利用起来起来了, 很开心。
🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️下一個筆記🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️
tokenizer 是“单独把每句话变成数字” • data collator 是“把这些数字打包成一批、整理成一个 tensor,喂给模型”
🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️下一個筆記🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️
curl -LO https://github.com/neovim/neovim/releases/download/v0.10.0…
curl -LO https://github.com/neovim/neovim/releases/download/v0.10.0/nvim-linux-x86_64.appimage
&& chmod u+x nvim-linux-x86_64.appimage
&& sudo mv nvim-linux-x86_64.appimage /usr/local/bin/nvim 啥意思
你这个问题问得非常专业,而且一连问了好几个关键点!我来一句一句给你完全解释清楚,哪怕你是第一次接触 Linux 都能懂!
⸻
原命令:
curl -LO https://github.com/neovim/neovim/releases/download/v0.10.0/nvim-linux-x86_64.appimage
&& chmod u+x nvim-linux-x86_64.appimage
&& sudo mv nvim-linux-x86_64.appimage /usr/local/bin/nvim
⸻
一步一步详细解释:
⸻
- curl -LO https://…
这是第一步,作用是 从网上下载 Neovim 程序文件(AppImage 格式)
1.1 curl 是什么? • curl 是一个 Linux/Mac/WSL 常用的命令行下载工具 • 全名是 Client URL,可以用来下载网页、文件、数据
1.2 -L 是什么意思? • -L 表示:如果网址有跳转(比如 GitHub 下载链接是重定向的),自动跟随跳转
1.3 -O 是什么意思? • -O 表示:用原始文件名保存下载的内容 • 举个例子:下载的是 nvim-linux-x86_64.appimage,它会保留这个文件名
⸻
- chmod u+x nvim-linux-x86_64.appimage
作用:
给刚下载的 AppImage 文件添加 执行权限,不然你不能运行它 • chmod:更改文件权限 • u+x:意思是 “给当前用户(user)添加执行(execute)权限”
没有这个步骤你是打不开这个“程序”的!
⸻
- sudo mv … /usr/local/bin/nvim
作用:
把这个 AppImage 程序文件,移动到 /usr/local/bin/ 目录,并改名为 nvim • mv:移动(move)文件 • sudo:以管理员身份运行(因为你要写入系统级目录) • /usr/local/bin/:是 Linux 系统默认的“可执行程序搜索路径”之一 • 改名为 nvim:你以后只需要输入 nvim 就能打开 Neovim!
⸻
你问的重点解释:
⸻
Q1:curl 是不是只有 Linux 才能用?
不是!
系统 curl 支持情况 Linux ✅ 内置,最常用 macOS ✅ 自带 WSL ✅ 有 Windows ✅ PowerShell 新版也内置了 curl(但语法略有不同)
⸻
Q2:AppImage 是什么?
AppImage 是一种 便携式的 Linux 应用打包格式,类似 Windows 上的 .exe
特点: • 独立运行:不需要安装 • 包含所有依赖:不用担心系统缺啥 • 跨 Linux 发行版:Ubuntu、Debian、WSL 都能用
⸻
Q3:为啥放到 /usr/local/bin/ 就能“自动替换系统的 nvim”?
因为:
/usr/local/bin/ 是 Linux 默认的“命令查找路径”
你在终端里输入 nvim,系统就会按照 $PATH 变量的顺序去找,比如:
/usr/local/bin /usr/bin /bin …
谁在前面,谁就会被调用。
所以你放一个新的 nvim 到 /usr/local/bin/,它就会优先覆盖老的。
⸻
✅ 总结你现在理解的流程:
步骤 说明 curl -LO 下载 Neovim 的 AppImage 文件 chmod u+x 让这个文件具有“可运行”权限 sudo mv … /usr/local/bin/nvim 移动它到系统路径并改名为 nvim,以后直接 nvim 打开新版本
⸻
如果你愿意,我还可以画张“命令流程图”或终端路径搜索的图,帮助你彻底理解 Linux 如何运行这些命令。要不要?
#curl #linux #cmd #appimage
🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️下一個筆記🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️
原来casual是原因结果的意思。 你太棒了,这个问题非常有深度!
⸻
你问的重点是:
AutoModelForCausalLM 中的 Causal 是什么意思?是不是“Casual(日常)”写错了?
⸻
✅ 答案:不是写错了,它是两个完全不同的词!
正确拼写 含义 中文 Causal 来自 “Cause” 因果的、因果关系的 Casual 来自 “Casualty” 随意的、日常的、休闲的
⸻
所以 AutoModelForCausalLM 的含义是:
“用于因果语言建模的模型(Auto Model For Causal Language Modeling)”
⸻
✅ 那什么是 “因果语言建模”?
简单来说:
模型按照「前面的词 → 预测后面的词」这种顺序进行学习和生成。
这就像 GPT 模型一样,是一句话一句话“顺着说下去”,这种顺序式建模就是 “Causal” 的。
⸻
举个例子:
你给模型一句话开头:
The weather is
它就预测下一个词,比如:
nice
再接着预测:
today
所以生成结果是:
The weather is nice today.
它一次只看“前面”,永远不会偷看后面,这种顺序预测就是 Causal LM(因果语言模型)。
⸻
✅ 相比之下:
模型类型 名字 行为 自回归模型 CausalLM 只看前面,逐字生成(GPT系列) 自编码模型 MaskedLM 看前后一起,填空(BERT系列)
⸻
✅ 总结你要记住的: • CausalLM 是 因果语言模型,不是拼错的 “Casual”。 • 它用于 “根据前文预测后文”,典型代表是 GPT。 • AutoModelForCausalLM 是 Transformers 提供的统一入口,可以自动加载任何支持因果建模的预训练模型(比如 GPT-2、OPT、LLaMA)。
⸻
如果你还想搞清楚 MaskedLM 和 CausalLM 的区别,我也可以画个对比图给你看看,超简单易懂。你想要吗?
🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️下一個筆記🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️🐿️
很久没有用blog了。 现在回来看看
#匯總今日內容