首頁手記參數高效微調PEFT(一)快速入門BitFit、Pro...

參數高效微調PEFT(一)快速入門BitFit、Prompt Tuning、Prefix Tuning - peft教程

標簽：

雜七雜八

概述

PEFT高效调参是一种参数优化技术，旨在减少微调预训练语言模型所需的计算和存储资源，通过微调模型的部分参数实现性能提升。本文快速介绍了三种PEFT方法：BitFit、Prompt Tuning和Prefix Tuning，并通过Llama-2-7b模型的实践案例和代码示例，展示了如何利用这些方法高效地微调模型。PEFT方法主要通过增加额外参数、选择性更新参数或引入重参数化来提升模型性能，同时大幅降低资源消耗。通过掌握PEFT方法的基本概念与实践，可以有效优化模型微调过程，适用于有资源限制的场景。

实践案例与示例代码

BitFit高效微调

BitFit方法专注于微调模型的偏置参数，特别是与特定任务相关的部分。在Llama-2-7b模型上，BitFit通过训练计算query、key、value的注意力模块以及MLP层和Normalization层的偏置参数，来实现高效微调。

from transformers import AutoTokenizer, AutoModelForCausalLM, TrainingArguments, Trainer
from peft import PeftModel, LoraConfig

# 加载预训练模型和tokenizer
model = AutoModelForCausalLM.from_pretrained("modelscope/Llama-2-7b-ms")
tokenizer = AutoTokenizer.from_pretrained("modelscope/Llama-2-7b-ms")

# 创建BitFit配置和模型实例
lora_config = LoraConfig(
    r=16, 
    lora_alpha=32, 
    target_modules=['q_proj', 'v_proj'], 
    lora_dropout=0.1, 
    bias="none", 
    task_type="CAUSAL_LM"
)

bitfit_model = PeftModel.from_pretrained(model, "my_peft_directory", config_dict=lora_config)

# 模型训练和保存
training_args = TrainingArguments(
    output_dir="./results",  
    per_device_train_batch_size=4,  
    gradient_accumulation_steps=8,  
    num_train_epochs=1,              
)

trainer = Trainer(
    model=bitfit_model,    
    args=training_args,      
    train_dataset=...,  
    data_collator=..., 
)

trainer.train()

Prompt Tuning方法简介

Prompt Tuning通过在模型的输入端添加任务特定的连续可微的前缀（virtual tokens），来引导模型生成期望的输出。在Llama-2-7b模型上应用Prompt Tuning，需要为不同的任务构造不同的前缀并微调这些前缀参数。

from peft import PrefixTuningConfig, PrefixTuningForCausalLM

prefix_tuning_config = PrefixTuningConfig(
    task_type="CAUSAL_LM",
    num_virtual_tokens=20,
    prefix_projection=True
)

prefix_tuning_model = PrefixTuningForCausalLM.from_pretrained("modelscope/Llama-2-7b-ms", config=prefix_tuning_config)

# 模型训练和保存
trainer_prefix = Trainer(
    model=prefix_tuning_model,    
    args=training_args,      
    train_dataset=...,  
    data_collator=..., 
)

trainer_prefix.train()

Prefix Tuning方法简介

Prefix Tuning方法通过在模型输入端添加任务特定的前缀，以引导模型生成预期输出。在Llama-2-7b模型上应用Prefix Tuning，涉及为不同任务构造前缀并微调这些前缀参数。

from peft import PrefixTuningConfig, PrefixTuningForCausalLM

prefix_tuning_config = PrefixTuningConfig(
    task_type="CAUSAL_LM",
    num_virtual_tokens=20,
    prefix_projection=True
)

prefix_tuning_model = PrefixTuningForCausalLM.from_pretrained("modelscope/Llama-2-7b-ms", config=prefix_tuning_config)

# 模型训练和保存
trainer_prefix = Trainer(
    model=prefix_tuning_model,    
    args=training_args,      
    train_dataset=...,  
    data_collator=..., 
)

trainer_prefix.train()

结论与展望

PEFT方法在提升模型效率和性能方面展现出巨大潜力，通过精确地微调模型参数，使得全量微调成为可能的场景下，只需较小的成本即可获得显著的性能提升。对于初学者而言，理解PEFT方法的基本概念，并尝试在简单任务上应用这些技术，是掌握高效模型微调的关键。未来的研究方向包括探索更高效、更灵活的参数微调策略，以及PEFT方法在更广泛领域的应用，以进一步降低模型微调的成本和提高资源利用率。

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優質文章

正在加載中

PIPIONE

手記
篇

粉絲

150

獲贊與收藏

704

關注作者，訂閱最新文章

閱讀免費教程

后端通用面試教程

41個小節 32258 360

網絡編程入門教程

20個小節 13303 250

Pandas 入門教程

25個小節 19925 373

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優惠券可用于購買實戰課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

參數高效微調PEFT(一)快速入門BitFit、Prompt Tuning、Prefix Tuning - peft教程

实践案例与示例代码

BitFit高效微调

Prompt Tuning方法简介

Prefix Tuning方法简介

閱讀免費教程

參數高效微調PEFT(一)快速入門BitFit、Prompt Tuning、Prefix Tuning - peft教程