首页
问答库
知识库
教程库
标签
AI工具箱
登录
注册
投稿
Baichuan-7B
+ 关注
文章:
0
|
问答:
0
|
关注:
0
暂无介绍
文章
|
问答
2
回答
124
浏览
Baichuan-7B 解决爆24G显存的方法
Baichuan-7B
其他
tp5buhyn
7个月前
浏览 (124)
7个月前 
8
回答
126
浏览
Baichuan-7B 给大家一个方便运行的程序代码(cli_demo.py),对多GPU支持更友好些,需要的可以复制过去跑一下
Baichuan-7B
其他
7fhtutme
7个月前
浏览 (126)
7个月前 
8
回答
118
浏览
Baichuan-7B LLaMA-Vicuna-13B 和 Baichuan-Vicuna-7B 的对比评测数据(由GPT4打分,供大家参考)
Baichuan-7B
其他
368yc8dk
7个月前
浏览 (118)
7个月前 
1
回答
87
浏览
Baichuan-7B lm-evaluation-harness中文项目能力测试结果,对比WizardLM[Question]
Baichuan-7B
其他
bvn4nwqk
7个月前
浏览 (87)
7个月前 
5
回答
119
浏览
Baichuan-7B [问题] 重复提问后,回答一直没有改变
Baichuan-7B
其他
0lvr5msh
7个月前
浏览 (119)
7个月前 
1
回答
116
浏览
Baichuan-7B 无法从'transformers.pytorch_utils'导入名称'id_tensor_storage',
Baichuan-7B
其他
c2e8gylq
7个月前
浏览 (116)
7个月前 
3
回答
122
浏览
Baichuan-7B [问题] 两个小问题:没有pad_token && 把不必要的buffer保存下来了
Baichuan-7B
其他
aydmsdu9
7个月前
浏览 (122)
7个月前 
3
回答
122
浏览
Baichuan-7B [问题] 明明内存充足,却显示内存不足,
Baichuan-7B
其他
iq3niunx
7个月前
浏览 (122)
7个月前 
5
回答
140
浏览
Baichuan-7B 是否有embeddings模型释放出来
Baichuan-7B
其他
ha5z0ras
7个月前
浏览 (140)
7个月前 
4
回答
125
浏览
Baichuan-7B 初步完成了多轮对话模型的指令微调
Baichuan-7B
其他
mrzz3bfm
7个月前
浏览 (125)
7个月前 
2
回答
113
浏览
Baichuan-7B [Question] deepspeed 无法使用zero3
Baichuan-7B
其他
qmb5sa22
7个月前
浏览 (113)
7个月前 
3
回答
113
浏览
Baichuan-7B [Question] Lora微调训练的时候报错
Baichuan-7B
其他
qlfbtfca
7个月前
浏览 (113)
7个月前 
4
回答
121
浏览
Baichuan-7B 有关哪个模型推理
Baichuan-7B
其他
l7wslrjt
7个月前
浏览 (121)
7个月前 
1
回答
93
浏览
Baichuan-7B [Question] 数据质量打分模型具体是用什么打的分?
Baichuan-7B
其他
kgsdhlau
7个月前
浏览 (93)
7个月前 
2
回答
110
浏览
[Question] baichuan-7b是否可以支持lora model 合并?
Baichuan-7B
其他
zengzsys
7个月前
浏览 (110)
7个月前 
6
回答
133
浏览
Baichuan-7B [BUG] requirements.txt 依赖冲突
Baichuan-7B
其他
piah890a
7个月前
浏览 (133)
7个月前 
7
回答
137
浏览
Baichuan-7B [问题] 单机单卡训练时,出现错误,无法初始化梯度,
Baichuan-7B
其他
stszievb
7个月前
浏览 (137)
7个月前 
1
回答
124
浏览
Baichuan-7B 请问部署推理时,最小的GPU显存需要多大?以及内存需要多大?[Question]
Baichuan-7B
其他
vsdwdz23
7个月前
浏览 (124)
7个月前 
1
回答
210
浏览
Baichuan-7B [Question] Baichuan模型中的Attention模块为什么在train的时候没有用到attention_mask?
Baichuan-7B
其他
nhaq1z21
7个月前
浏览 (210)
7个月前 
3
回答
124
浏览
Baichuan-7B [Question] 训练垂直领域的模型,增量预训练的token数需要达到多少才能有比较好的效果?
Baichuan-7B
其他
jmo0nnb3
7个月前
浏览 (124)
7个月前 
1
回答
120
浏览
Baichuan-7B [Question] 请问7B没有用上FlashAttention吗?
Baichuan-7B
其他
prdp8dxp
7个月前
浏览 (120)
7个月前 
3
回答
195
浏览
Baichuan-7B [Question] DeepSpeed Zero3 save_checkpoint() got empty mode_states files
Baichuan-7B
Go
a6b3iqyw
7个月前
浏览 (195)
7个月前 
5
回答
161
浏览
Baichuan-7B [BUG] CUDA内存不足,当评估模型时,
Baichuan-7B
其他
y1aodyip
7个月前
浏览 (161)
7个月前 
1
回答
121
浏览
Baichuan-7B [问题] RoPE的实现与论文中的描述不一致,
Baichuan-7B
其他
w3nuxt5m
7个月前
浏览 (121)
7个月前 
1
回答
168
浏览
Baichuan-7B [BUG] 我下载了huggingface上的baichuan7b模型,使用里面的测试程序测试发现CUDA错误,
Baichuan-7B
其他
lsmd5eda
7个月前
浏览 (168)
7个月前 
1
回答
126
浏览
Baichuan-7B [Question]不能安装xformers
Baichuan-7B
其他
m1m5dgzv
7个月前
浏览 (126)
7个月前 
首页
上一页
1
下一页
末页
热门标签
更多
Java
query
python
Node
开发语言
request
Util
数据库
Table
后端
算法
Logger
Message
Element
Parser
最新问答
更多
xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1)
发布于
5个月前
xxl-job 不能和nacos兼容?
回答(3)
发布于
5个月前
xxl-job 任务执行完后无法结束,日志一直转圈
回答(3)
发布于
5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1)
发布于
5个月前
xxl-job 参数512字符限制能否去掉
回答(1)
发布于
5个月前