我们如何针对扩展区块微调? #3

win10ogod · 2024-01-10T00:57:27Z

我们如何针对扩展区块微调?

win10ogod · 2024-01-10T08:24:50Z

@hills-code How do we train for extended blocks?

hills-code · 2024-01-18T06:09:56Z

感谢关注！我把训练代码上传了在这个repo下面了，也可以查看https://github.com/hills-code/open-instruct/tree/llama-pro

JohnZhuYX · 2024-02-05T07:40:11Z

hills-code · 2024-02-05T07:46:33Z

这个项目是SFT的训练，在这个阶段是所有参数一起训练，和普通的SFT是一致的；在Pretrain的时候会冻结参数，具体的操作在这里https://github.com/hills-code/open-instruct/blob/7c2b14d3d319028c68657946ca2c16b248f866e8/open_instruct/customized_trainer.py#L53

JohnZhuYX · 2024-02-18T03:12:33Z

我看了customized_trainer.py这个文件，但是这个文件只是用于扩展模型，也就是把一个7B的模型变成一个8B的模型，但是增加的块都是初始状态，没有被训练。有没有针对这些新增块（也就是冻结所有原始块）进行PT轮训练的DEMO

Provide feedback