首頁手記構建自己的大模型

構建自己的大模型

標簽：

雜七雜八

在构建大模型的过程中，选择合适的基座模型至关重要，本文以表现优异的开源基座模型ChatGLM3-6B为例，详细指导如何进行环境安装与模型加载。本文涵盖了从代码调用到网页版、命令行等多种加载方式，并提供了低成本部署策略，如模型量化、CPU部署、Mac部署和多卡部署。对于希望构建个性化大模型的用户，我们将展示如何使用自己的数据集对ChatGLM3-6B进行微调，包括数据准备、有监督微调以及部署自定义模型。此外，文章还提供了应对挑战与解决技巧，如灾难遗忘问题的解决方案和程序思维提示方法，以提升模型性能。为了帮助开发者深入学习，我们整理了丰富的学习资源与支持，包括AI大模型入门路线图、报告合集、经典PDF资料及商业化落地方案，旨在推动AI大模型技术的发展。

一、选择基座模型与环境搭建

在构建大模型的过程中，选择合适的基座模型是至关重要的一步。这里以ChatGLM3-6B为例，它是在多个评测数据集中的表现优异的开源基座模型之一。接下来，我们将详细说明如何进行环境安装与模型加载：

1.1 环境安装

首先，需要安装相关的开发环境和依赖包。通过Git从GitHub仓库中克隆ChatGLM3-6B的代码，并确保使用了合适的依赖版本：

git clone https://github.com/THUDM/ChatGLM3
cd ChatGLM3
pip install -r requirements.txt

对于依赖的transformers库和torch，推荐使用版本4.30.2和2.0及以上版本，以确保获得最佳推理性能。

1.2 模型加载

加载ChatGLM3-6B模型可以有多种方式，包括通过代码调用、网页版、命令行或工具调用等。

代码调用：通过transformers库加载并进行基础对话示例。

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True)
model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)

网页版：使用Gradio或Streamlit在线交互界面。
- Gradio：启动基于Gradio的示例界面的命令。
- Streamlit：启动基于Streamlit的网页版的命令。
命令行：在命令行界面进行交互式对话。
```
python cli_demo.py
```
本地加载：如果网络环境不佳，可以从本地仓库加载模型，先执行git lfs install安装Git LFS，然后下载模型参数。

二、低成本部署策略

部署大模型时，考虑成本优化和资源效率至关重要。以下是一些低成本部署策略：

2.1 模型量化

通过降低模型精度（例如，从FP16到FP4）来减少内存占用和加速推理速度。这可以通过模型量化来实现：

model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True).quantize(4)

2.2 CPU部署

在没有高性能GPU的环境下，可以使用CPU进行推理。这需要预先调整模型以适应CPU环境，例如：

model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True).float()

2.3 Mac部署

对于Mac用户，可以利用MPS（Metal for Machine Learning）后端来加速推理过程。请注意，直接加载大模型通常需要较多的内存，考虑使用虚拟内存时需要评估性能影响。

2.4 多卡部署

在多GPU环境中，通过模型并行化策略可以有效利用额外的计算资源。使用accelerate库可以轻松地将模型分割到多个GPU上：

from accelerate import Accelerator
model = Accelerator().prepare(model)

三、构建个性化大模型

为了适应特定的应用场景，需要对基座模型进行微调。以下步骤展示了如何使用自己的数据集对ChatGLM3-6B进行微调：

3.1 数据准备

首先，下载并准备数据集，如广告文案生成所需的AdvertiseGen数据集。数据集应被分割为训练集和验证集，并按照预期的键值格式存储。

3.2 有监督微调

通过修改微调脚本中的参数来适应新的数据集和任务：

bash ds_train_finetune.sh --model_name_or_path ../models/chatglm3-6b --train_file AdvertiseGen/train.json --test_file AdvertiseGen/dev.json --prompt_column content --response_column summary --learning_rate 1e-5 --num_train_epochs 1

3.3 部署自定义模型

微调完成后，使用Streamlit启动模型，实现与用户的交互：

streamlit run web_demo2.py

四、应对挑战与解决技巧

3.4 灾难遗忘问题

通过引入多样化的数据集进行微调，以增强模型的泛化能力，减轻灾难遗忘问题。

3.5 程序思维提示

对于数值推理和复杂计算，可以采用思维程序提示（Program of Thoughts Prompting）方法，将计算部分与推理过程分离，利用外部的计算引擎执行计算任务。

五、学习资源与支持

为了帮助广大开发者，我们整理了一份丰富的学习资源包，包括：

AI大模型入门路线图：提供从基础到进阶的全面学习路径。
640套AI大模型报告合集：海量报告以助你深入理解大模型的最新进展。
经典AI大模型PDF资料：精选书籍和论文，涵盖理论与实践。
商业化落地方案：探索大模型在不同行业的应用案例。

通过这些资源，无论是初学者还是资深开发者，都能找到适合自己的学习路径和实践机会，共同推动AI大模型技术的发展。

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優質文章

正在加載中

叮當貓咪

手記
篇

粉絲

6

獲贊與收藏

28

關注作者，訂閱最新文章

閱讀免費教程

后端通用面試教程

41個小節 32210 359

網絡編程入門教程

20個小節 13298 250

Pandas 入門教程

25個小節 19917 373

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優惠券可用于購買實戰課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空