目前服务列表
gpt-neo-125m 流程练习
事务同步
中文资料 楠 完成
安全类资料 楠 完成
将以上资料转为 txt - 张
- 清洗 资料 目前进度 (挑选了 6017 本电子书 ) (在书中挑选了 4892742 行 txt )
- (挑选标准目前是 , 太短不要 , 太长不要 , 太简单不要 , 关于简单,目前有2个算法 , 一个是 字符数 , 另一个是 ‘方和’ )
- 中文语料打分系统
- 语料标注(promptsource) tzm
- 偏好训练
- opt 175 -
bloom 175 - 关
- secruity - playgroud 关 童
nat/openplayground - 关
- 代码归集 git notebook
- dolly - 测试,训练代码
- moss - 测试,训练代码
- belle - 测试,训练代码
- llama 65 - 测试,训练代码
- bloomz 175 - 训练代码
- 寻找 a100 云服务 h100 也行
- 标注语料 - 恶代相关
- 标注语料 - 网安相关
- 标注语料 - 雾zhi
- 四月总结 - notion
- 签署 MOSS 授权协议
- 考察brat
目前机器列表
- v100 - 28.1 主要阿关使用
- v100 - 28.2 王老师
- v100 - 28.3 童
- 3090x8 - 28.4 王老师 , 关
数据集