metiy.xyz
导航页
View the Project on GitHub
leiwhere/cf-pages-metiy-xyz
pip install -i https://pypi.mirrors.ustc.edu.cn/simple/
other
在一张 24 GB 的消费级显卡上用 RLHF 微调 20B LLMs
大语言模型快速推理:在 Habana Gaudi2 上推理 BLOOMZ
StackLLaMA:使用 RLHF 训练 LLaMA 的实践指南
大模型训练实战
RLHF 实践教程: 训练 LLaMA 模型回答 Stack Exchange 上的问题 作者:HuggingFace
使用 LoRA 和 Hugging Face 高效训练大语言模型
Hugging News #0428: HuggingChat 来啦!
使用 DeepSpeed 和 Hugging Face Transformer 微调 FLAN-T5 XL/XXL
2.7B 的代码补全模型
OpenLLama 项目,LLama模型的开源复现
闻达:一个大规模语言模型调用平台
发布几个RWKV的Chat模型(包括英文和中文)7B/14B欢迎大家玩
[当你有100万GPU小时,如何选择合适的语言模型](arXiv:2210.15424)
标注 bigscience-workshop/prompt source
star coder huggingface playground
star coder endpoint server
huggingface chat
OpenAI API兼容项目
开源 LLMOps 平台
Cisco AnyConnect Secure Mobility Client 下载
注册美区 apple id 以便安装 poe wireguard 等
Meta AI 发布的 MEGABYTE 模型,无需 tokenizer 厂上下文,复杂度 seq_len 的 4/3 次方模型
有卖 api 的,不知道真假
chatml 说明
chat api 说明
baichuan2 需要 4.33.2
git pull fail
git stash save “sfgsdgfsdgsg”
训练过程的猜测
学习单词
学习句子
简单背诵句子
开始 磕巴 —– 许多时间
开始理解简单逻辑关系
。。。