乐胖代购免代理版

mindspeed-llm源码解析（一）preprocess_data

mindspeed-llm是昇腾模型套件代码仓，原来叫"modelLink"。这篇文章带大家阅读一下数据处理脚本preprocess_data.py（基于1.0.0分支），数据处理是模型训练的第一步，经常会用到。文章中贴的源码加了相关注释，同学们可以把源码和注释结合起来看。首先来看一下main函数 def main(): # 获取入参，通过后面的代码可以知道有哪些关

AI

原创

AI布道Mr_Jin

2月前

130阅读

百万级超长序列大模型训练如何加速，硬核解读MindSpeed方案

针对现有长序列训练场景的痛点，MindSpeed在并行算法、计算效率、内存占用以及通信四个维度系统性优化大模型长序列训练效率，支持大模型百万级长序列训练。

并行算法

MindSpeed

分布式训练

大模型

长序列

原创

华为云开发者联盟

7月前

450阅读

1点赞

变色龙chameleon模型适配昇腾做训练开发

变色龙chameleon模型的官方仓库(https://github.com/facebookresearch/chameleon)并未开源训练的源代码，需要做训练代码的开发。开发方向昇腾modellink（已改名MindSpeed-LLM）的代码仓(https://Ascend/MindSpeed-LLM)具备llm的训练能力，但不支持多模态，不适配变色龙模型。根据变色龙的论文，变色龙模型的结构

数据

模态

输入输出

原创

做光和盐

2月前

80阅读

昇腾Chatglm3-6b模型微调迁移实践

在自然语言处理领域，模型微调是一种强大的技术，可以让预训练模型适应特定的任务和数据集。本文将详细介绍如何使用昇腾LLM分布式训练框架MindSpeed-LLM 进行 ChatGLM3-6B 模型的微调迁移，并结合工具进行性能分析和数据解析。一、迁移准备参考文档主要参考昇腾LLM分布式训练框架MindSpeed-LLM 中的使用方式和流程进行迁移。二、迁移步骤首先

AI

人工智能

chatgpt

自然语言处理

原创

mb67cecec50bdd2

1月前

68阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

MindSpeed

mindspeed-llm源码解析（一）preprocess_data

百万级超长序列大模型训练如何加速，硬核解读MindSpeed方案

变色龙chameleon模型适配昇腾做训练开发

昇腾Chatglm3-6b模型微调迁移实践

html5响应式滚动

it运维知识

java

linux怎么打开我的电脑

安装ssh时ip地址

数据库的查询思路

本地安装mysql服务

查看linux远程端口

考ccnp还是linux

软考嵌入式真题