unsloth studio微调尝试
毕设要做大模型微调,由于之前实习的时候有用llama-factory微调的经验,所以本来想直接用llama-factory来单卡微调的。结果在modelscope上下载模型时意外发现了unsloth这个大模型微调工具,和llama-factory一样,开发了gui界面,也就是unsloth studio,而且声称其单卡微调速度更快,内存占用更少,于是我想试一下用unsloth来微调,正好我目前也是在autodl上租单卡服务器。结果折腾了半天还是放弃了😭。写篇文章记录一下,希望不久能重新跑成功。
尝试在Windows上跑通
我的思路:先在本地把训练跑通,再把文件和环境上传到服务器上正式训练。本地os是Windows10,按照文档步骤在powershell里运行
1 | irm https://unsloth.ai/install.ps1 | iex |
结果发现这个脚本只支持创建python自带的虚拟环境venv,不支持conda环境,原因在注释中写道:conda 自带的 CPython 在 Windows 上可能导致 torch 的 c10.dll 加载问题。…也行吧,脚本运行完后,成功launch unsloth。但是似乎不能像llama-factory一样加载当前目录下的模型文件,只能加载.cache/huggingface/hub中的模型。


想了想算了,反正只是跑通训练,就暂时不管这个设置好参数start training了。结果训练报错,说无法下载causall-conv1d,是个专为时间序列数据处理优化的库,关键是只适用于Linux…我去不早说?不下载也可以,但是就用不了flash attention2等加速方式,虽然我也没在studio界面上找到可以修改加速方式的地方,最终放弃在Windows上跑通了,转战Linux。
尝试在Linux上跑通
用Linux启动unsloth studio,然后端口转发到本地,用本地浏览器打开unsloth studio,结果发现数据集上传方式只能从本地拖动上去(?)上传上去后view dataset一直加载不出来…然后start training在Installing causal-conv1d from PyPI这一步卡住了,还是在给服务器配置代理的条件下,等了20min无反应,没办法租服务器太贵了,我不想等了就直接投靠回llama-factory了

总结
还没试过用unsloth core来开发,只是我比较习惯gui界面。写篇文章记录一下踩过的坑,我还是很希望能够用unsloth core或者unsloth studio跑一次单卡训练的👉👈
- 标题: unsloth studio微调尝试
- 作者: YuDou
- 创建于 : 2026-04-12 15:18:30
- 更新于 : 2026-04-12 08:42:34
- 链接: https://sweetyudou.github.io/2026/04/12/unsloth studio微调尝试/
- 版权声明: 版权所有 © YuDou,禁止转载。