乐胖代购免代理版

数据隐私

自动生成

应用场景

原创 5月前 36 阅读

解决混合精度训练大模型的局限性问题

混合精度训练在加速深度学习训练中发挥了重要作用，但存在数值不稳定性问题。本文将探讨如何解决混合精度训练大模型的局限性问题，以实现更高效、稳定的训练。

深度学习

数据类型

泛化

原创 5月前 12 阅读

Open WebUI大模型对话平台：适配Ollama的实践与探索

随着人工智能技术的快速发展，大模型对话平台在各个领域的应用越来越广泛。本文介绍了Open WebUI大模型对话平台如何适配Ollama模型，并提供了实际操作建议，帮助读者更好地理解和应用相关技术。

模态

Web

应用场景

原创 5月前 224 阅读

基于Fluid与JindoCache的大模型训练加速实践

本文介绍了如何使用PaddlePaddle的Fluid框架与JindoCache分布式缓存系统，通过优化数据加载和计算流程，实现大模型训练的加速。

数据加载

深度学习

分布式缓存

原创 5月前 51 阅读

利用预训练模型优化大模型训练

本文介绍了如何利用预训练模型优化大模型的训练过程，包括数据预处理、模型选择、预训练、微调、训练评估以及部署应用等步骤，旨在帮助读者更好地理解和应用预训练模型，提高大模型的训练效率和性能。

数据

数据预处理

最优解

原创 5月前 102 阅读

利用大模型训练提升AI性能

在人工智能领域，大模型训练已成为提升AI性能的关键。本文将探讨如何利用大模型训练提升AI性能，并介绍一些实用的方法和技巧。

数据集

数据

特征提取

原创 5月前 54 阅读

大模型微调方法总结：LoRA, Adapter, Prefix-tuning, P-tuning, Prompt-tuning

随着自然语言处理（NLP）技术的不断发展，大模型微调（finetune）方法成为了提高模型性能的关键手段。本文将对LoRA、Adapter、Prefix-tuning、P-tuning和Prompt-tuning等主流微调方法进行总结，帮助读者更好地理解和应用这些技术。

提示信息

机器翻译

问答系统

原创 5月前 166 阅读

LoRA微调语言大模型的实用技巧与实践

LoRA微调技术在大型语言模型中的应用，通过选择适当的预训练模型、明确微调目标、准备标注数据集、调整超参数和监控训练过程等步骤，实现模型的高效微调。本文旨在为非专业读者提供清晰易懂的技术指导，帮助读者掌握LoRA微调语言大模型的实用技巧。

数据集

语言模型

数据

原创 5月前 38 阅读

AI绘图新选择：Fooocus工具发布，小显存助力大模型运行

随着AI技术的快速发展，图像生成软件成为了创作者们的得力助手

ooc

深度学习

优化算法

原创 5月前 155 阅读

LoRA微调语言大模型的实用技巧

本文将介绍LoRA微调语言大模型的实用技巧，帮助读者更好地理解和应用这一技术。

自然语言处理

数据

数据集

原创 6月前 58 阅读

大模型微调提升AI应用性能

本文将介绍一种有效的技术手段——大模型微调，通过对其原理、方法和实际应用案例的详细解析，帮助读者深入了解并掌握这一关键技术，提高AI应用的性能。

数据集

应用场景

人工智能

原创 6月前 56 阅读

大模型Chatbots评估新视角：结合定性与程序方法的实践探索

本文将从定性和程序方法两个角度出发，探讨Chatbots评估的新视角，并结合实践经验提供可操作的建议和解决方法。

性能分析

人工智能

语言模型

原创 6月前 9 阅读

LLaMA 2语言大模型的微调策略：LoRA与全参数选择

本文将深入探讨LLaMA 2语言大模型在微调过程中，选择LoRA技术与全参数方法的优缺点，并结合实际应用场景，为开发者提供有价值的建议。

数据集

开发者

语言模型

原创 6月前 72 阅读

BELLE大模型量化推理性能测试

本文介绍了使用GPTQ量化技术对BELLE大模型（基于LLaMA-7B和Bloomz-7B1-mt）进行量化处理后的推理性能测试。

数据集

性能测试

自然语言处理

原创 6月前 13 阅读

GLM国产大模型训练加速：高效性能与成本优化的实践

本文将介绍GLM国产大模型在训练过程中的性能优化，通过OneFlow框架实现的高效训练和显存节省，使得模型训练成本大大降低，为深度学习领域的实际应用提供了新的突破。

深度学习

性能提升

开发者

原创 6月前 27 阅读

LLaMA 2语言大模型的微调策略：LoRA与全参数选择

本文将深入探讨LLaMA 2语言大模型在微调过程中，选择LoRA技术与全参数方法的优缺点，并结合实际应用场景，为开发者提供有价值的建议。

数据集

开发者

语言模型

原创 6月前 73 阅读

探索时间序列大模型：TimeGPT的魅力与实践

：时间序列分析在金融、医疗、气象等领域具有广泛应用。

数据

时间序列

数据集

原创 6月前 97 阅读

利用飞桨与文心大模型重塑大宗商品数字供应链

数链科技借助飞桨深度学习平台和文心大模型技术，打造大宗商品数字供应链系统，通过智能化手段提升行业透明度与标准化水平，为大宗商品行业带来革命性变革。

深度学习

供应链管理

原创 6月前 27 阅读

文档图像大模型

本文将介绍文档图像大模型的基本原理、技术特点以及在智能文档处理中的应用实例，帮助读者理解并应用这一技术。

文档处理

深度学习

高精度

原创 6月前 72 阅读

Hugging Face推出全新代码大模型：支持80+编程语言，集成VSCode

Hugging Face近日发布了一款全新的代码大模型，该模型支持80+种编程语言，并与VSCode进行了集成，为用户提供了前所未有的代码智能支持和编程体验。

代码片段

自动生成

编程语言

原创 6月前 28 阅读

从零开始学习大模型

在本文中，我们将深入探讨如何创建一个大模型。我们将从数据收集、预处理、模型设计等方面进行详细解析，帮助读者理解并掌握大模型的创建过程。

数据

编码器

预处理

原创 6月前 40 阅读

深度解析大模型推理框架：原理、应用与实践

本文将简明扼要地介绍大模型推理框架的原理、应用领域和实践经验，帮助读者理解并应用这一复杂的技术概念。通过生动的语言和实例，我们将揭示大模型推理框架如何在实际应用中发挥作用。

深度学习

人工智能

神经网络模型

原创 6月前 177 阅读

金融领域中的大模型Lora微调：实战应用与性能优化

本文介绍了在金融领域如何使用Lora框架进行大规模模型的微调，包括数据准备、模型构建、训练、评估、参数调整、优化和部署等步骤，通过实战案例，展示了如何提高模型的预测精度和泛化能力。

深度学习

数据

数据集

原创 6月前 76 阅读

智能制造与AI大模型

本文介绍了AI大模型在智能制造领域的应用及其重要性。AI大模型通过强大的计算和数据分析能力，优化了生产过程，提高了生产效率和质量。同时，AI大模型还推动了生产线的自动化和协同化，以及产品设计和开发的创新。

数据

产品设计

数据安全

原创 6月前 50 阅读

大模型分布式训练并行技术

在深度学习领域，大模型的训练通常需要使用大量的数据和计算资源。为了提高训练效率，数据并行成为一种常见的分布式训练策略。本文将深入解析数据并行的原理、应用场景和优势，为读者提供实际应用的建议。

数据

数据集

通信协议

原创 6月前 75 阅读

人工智能大模型引领数据库存储革新

随着人工智能大模型的崛起，数据库存储面临前所未有的挑战。传统的行存储和列存储模式已难以满足大规模数据处理的需求。本文将探讨行列混合存储的优势，以及如何在实践中应用这种新型存储模式，为数据库存储的未来发展提供新思路。

人工智能

数据

数据库

原创 6月前 60 阅读

开源大模型或将超越闭源模型

随着开源人工智能模型的兴起，一场关于专有模型与开源模型之间的竞赛正在加剧。在2023年底，Meta首席AI科学家Yann LeCun对开源模型的发展表示了高度关注，并预测开源大模型正走在超越专有模型的路上。本文将详细解读这一趋势，并探讨开源模型如何影响AI领域的未来发展。

开发者

应用场景

开源社区

原创 6月前 40 阅读

LLama2大模型指令微调实操：解锁AI生成文本的新境界

随着人工智能技术的不断发展，大模型已经成为了一种趋势。作为其中的佼佼者，LLama2大模型凭借其卓越的性能和广泛的应用场景，受到了越来越多的关注。然而，如何让LLama2更好地适应我们的需求，生成更加个性化的文本呢？这就需要我们进行指令微调。一、LLama2大模型简介LLama2是一款经过预训练和微调的生成式文本模型，可免费用于研究和商业用途。相较于上一代模型，LLama2的训练数据提升了40%，

数据集

人工智能

加载

原创 6月前 78 阅读

开源语言大模型

本文将带您了解开源语言大模型的原理、选择与应用，通过生动的实例和清晰的图表，帮助非专业读者也能轻松掌握复杂的技术概念，为您的实践提供有力的指导。

源语言

数据

自然语言处理

原创 6月前 55 阅读

星辰AI大模型TeleChat-7B

本文深入探讨了中国电信开源的星辰语义大模型TeleChat-7B，从技术原理、性能评估、实际应用等方面为读者展现了这个千亿参数大模型的魅力。文章旨在为非专业读者提供易于理解的技术解读，并分享实践经验和可操作的建议。

开发者

人工智能

原创 6月前 98 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

wx64f58501132c0的博客

欢迎

OpenAI文生视频大模型Sora：重塑视频内容生产

解决混合精度训练大模型的局限性问题

Open WebUI大模型对话平台：适配Ollama的实践与探索

基于Fluid与JindoCache的大模型训练加速实践

利用预训练模型优化大模型训练

利用大模型训练提升AI性能

大模型微调方法总结：LoRA, Adapter, Prefix-tuning, P-tuning, Prompt-tuning

LoRA微调语言大模型的实用技巧与实践

AI绘图新选择：Fooocus工具发布，小显存助力大模型运行

LoRA微调语言大模型的实用技巧

大模型微调提升AI应用性能

大模型Chatbots评估新视角：结合定性与程序方法的实践探索

LLaMA 2语言大模型的微调策略：LoRA与全参数选择

BELLE大模型量化推理性能测试

GLM国产大模型训练加速：高效性能与成本优化的实践

LLaMA 2语言大模型的微调策略：LoRA与全参数选择

探索时间序列大模型：TimeGPT的魅力与实践

利用飞桨与文心大模型重塑大宗商品数字供应链

文档图像大模型

Hugging Face推出全新代码大模型：支持80+编程语言，集成VSCode

从零开始学习大模型

深度解析大模型推理框架：原理、应用与实践

金融领域中的大模型Lora微调：实战应用与性能优化

智能制造与AI大模型

大模型分布式训练并行技术

人工智能大模型引领数据库存储革新

开源大模型或将超越闭源模型

LLama2大模型指令微调实操：解锁AI生成文本的新境界

开源语言大模型

星辰AI大模型TeleChat-7B