首页
问答库
知识库
教程库
标签
AI工具箱
登录
注册
投稿
Baichuan-7B
+ 关注
文章:
0
|
问答:
0
|
关注:
0
暂无介绍
文章
|
问答
2
回答
185
浏览
Baichuan-7B 解决爆24G显存的方法
Baichuan-7B
其他
tp5buhyn
9个月前
浏览 (185)
9个月前
8
回答
195
浏览
Baichuan-7B 给大家一个方便运行的程序代码(cli_demo.py),对多GPU支持更友好些,需要的可以复制过去跑一下
Baichuan-7B
其他
7fhtutme
9个月前
浏览 (195)
9个月前
8
回答
188
浏览
Baichuan-7B LLaMA-Vicuna-13B 和 Baichuan-Vicuna-7B 的对比评测数据(由GPT4打分,供大家参考)
Baichuan-7B
其他
368yc8dk
9个月前
浏览 (188)
9个月前
1
回答
172
浏览
Baichuan-7B lm-evaluation-harness中文项目能力测试结果,对比WizardLM[Question]
Baichuan-7B
其他
bvn4nwqk
9个月前
浏览 (172)
9个月前
5
回答
189
浏览
Baichuan-7B [问题] 重复提问后,回答一直没有改变
Baichuan-7B
其他
0lvr5msh
9个月前
浏览 (189)
9个月前
1
回答
196
浏览
Baichuan-7B 无法从'transformers.pytorch_utils'导入名称'id_tensor_storage',
Baichuan-7B
其他
c2e8gylq
9个月前
浏览 (196)
9个月前
3
回答
204
浏览
Baichuan-7B [问题] 两个小问题:没有pad_token && 把不必要的buffer保存下来了
Baichuan-7B
其他
aydmsdu9
9个月前
浏览 (204)
9个月前
3
回答
193
浏览
Baichuan-7B [问题] 明明内存充足,却显示内存不足,
Baichuan-7B
其他
iq3niunx
9个月前
浏览 (193)
9个月前
5
回答
205
浏览
Baichuan-7B 是否有embeddings模型释放出来
Baichuan-7B
其他
ha5z0ras
9个月前
浏览 (205)
9个月前
4
回答
207
浏览
Baichuan-7B 初步完成了多轮对话模型的指令微调
Baichuan-7B
其他
mrzz3bfm
9个月前
浏览 (207)
9个月前
2
回答
186
浏览
Baichuan-7B [Question] deepspeed 无法使用zero3
Baichuan-7B
其他
qmb5sa22
9个月前
浏览 (186)
9个月前
3
回答
198
浏览
Baichuan-7B [Question] Lora微调训练的时候报错
Baichuan-7B
其他
qlfbtfca
9个月前
浏览 (198)
9个月前
4
回答
182
浏览
Baichuan-7B 有关哪个模型推理
Baichuan-7B
其他
l7wslrjt
9个月前
浏览 (182)
9个月前
1
回答
183
浏览
Baichuan-7B [Question] 数据质量打分模型具体是用什么打的分?
Baichuan-7B
其他
kgsdhlau
9个月前
浏览 (183)
9个月前
2
回答
194
浏览
[Question] baichuan-7b是否可以支持lora model 合并?
Baichuan-7B
其他
zengzsys
9个月前
浏览 (194)
9个月前
6
回答
209
浏览
Baichuan-7B [BUG] requirements.txt 依赖冲突
Baichuan-7B
其他
piah890a
9个月前
浏览 (209)
9个月前
7
回答
216
浏览
Baichuan-7B [问题] 单机单卡训练时,出现错误,无法初始化梯度,
Baichuan-7B
其他
stszievb
9个月前
浏览 (216)
9个月前
1
回答
191
浏览
Baichuan-7B 请问部署推理时,最小的GPU显存需要多大?以及内存需要多大?[Question]
Baichuan-7B
其他
vsdwdz23
9个月前
浏览 (191)
9个月前
1
回答
292
浏览
Baichuan-7B [Question] Baichuan模型中的Attention模块为什么在train的时候没有用到attention_mask?
Baichuan-7B
其他
nhaq1z21
9个月前
浏览 (292)
9个月前
3
回答
191
浏览
Baichuan-7B [Question] 训练垂直领域的模型,增量预训练的token数需要达到多少才能有比较好的效果?
Baichuan-7B
其他
jmo0nnb3
9个月前
浏览 (191)
9个月前
1
回答
183
浏览
Baichuan-7B [Question] 请问7B没有用上FlashAttention吗?
Baichuan-7B
其他
prdp8dxp
9个月前
浏览 (183)
9个月前
3
回答
279
浏览
Baichuan-7B [Question] DeepSpeed Zero3 save_checkpoint() got empty mode_states files
Baichuan-7B
Go
a6b3iqyw
9个月前
浏览 (279)
9个月前
5
回答
257
浏览
Baichuan-7B [BUG] CUDA内存不足,当评估模型时,
Baichuan-7B
其他
y1aodyip
9个月前
浏览 (257)
9个月前
1
回答
184
浏览
Baichuan-7B [问题] RoPE的实现与论文中的描述不一致,
Baichuan-7B
其他
w3nuxt5m
9个月前
浏览 (184)
9个月前
1
回答
240
浏览
Baichuan-7B [BUG] 我下载了huggingface上的baichuan7b模型,使用里面的测试程序测试发现CUDA错误,
Baichuan-7B
其他
lsmd5eda
9个月前
浏览 (240)
9个月前
1
回答
224
浏览
Baichuan-7B [Question]不能安装xformers
Baichuan-7B
其他
m1m5dgzv
9个月前
浏览 (224)
9个月前
首页
上一页
1
下一页
末页
热门标签
更多
Java
query
python
Node
开发语言
request
Util
数据库
Table
后端
算法
Logger
Message
Element
Parser
最新问答
更多
xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1)
发布于
8个月前
xxl-job 不能和nacos兼容?
回答(3)
发布于
8个月前
xxl-job 任务执行完后无法结束,日志一直转圈
回答(3)
发布于
8个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1)
发布于
8个月前
xxl-job 参数512字符限制能否去掉
回答(1)
发布于
8个月前