乐胖代购免代理版

KTransformers实战DeepSeek-R1-1.58bit量化模型

本文介绍了国产的大模型推理工具KTransformers在本地成功运行的一个案例，在容器化部署的基础上，结合Open WebUI做了一个用户友好的大模型服务。技术背景在上一篇文章中，我们介绍过KTransformers大模型高性能加载工具的安装和使用方法。但是当时因为是在一个比较老旧的硬件上面进行测试，其实并没有真正的运行起来。现在补一个在KTransfo

json

docker

Docker

原创精选 12天前 261 阅读

Cython与CUDA之BatchGather

以学习CUDA为目的，接上一篇关于Cython与CUDA架构下的Gather算子实现，这里我们加一个Batch的维度，做一个BatchGather的简单实现。

CUDA

Cython

Time

原创 20天前 80 阅读

DeepSeek满血版测试

本文收集了一些目前为止仅有DeepSeek满血版可以正确答复的“简单问题”，以供测试和验证自己所使用的模型是满血版De

ci

问题集

参数设置

原创 28天前 213 阅读

bin格式转safetensors

本文介绍了一种将Hugging Face上bin格式的大模型文件，在线转换为safetensors文件格式，然后下载到本地的方法。

python

json

Salesforce

原创精选 28天前 208 阅读

CUDA异常捕获

本文主要介绍了在CUDA编程的实践中，增加一个异常捕获的宏模块，以保障CUDA项目结果的准确性。主要代码内容参

CUDA

#include

异常捕获

原创 28天前 60 阅读

CUDA时长统计

这篇文章主要介绍了一个CUDA入门的技术：使用CUDA头文件写一个专门用于CUDA函数运行时长统计

CUDA

Time

#include

原创 28天前 826 阅读

Cython与CUDA之Gather

本文使用了Cython作为封装函数，封装一个CUDA C实现的Gather算子，然后通过Python去调用，用这种方法实现一个比较Pythonic的CUDA Gather函数的实现和调用。

CUDA

Cython

数组

原创 28天前 72 阅读

DeepSeek本地性能调优

对于本地模型的加载来说，除了使用KTransformer等工具进行指令集层面的优化之外，还可以调整模

加载

共享内存

资源分配

原创精选 1月前 369 阅读

Ollama模型迁移

为了方便本地大模型部署和迁移，本文提供了一个关于Ollama的模型本地迁移的方法。

3d

ci

f5

原创 1月前 142 阅读

DeepSeek模型量化

这篇文章主要介绍了llama.cpp这一大模型工具的使用。因为已经使用Ollama来run大模型，因此仅介绍了llama.cpp在H

python

CUDA

git

原创 1月前 204 阅读

DeepSeek智能编程

本文介绍了两种智能编程的方案，一种是使用Cursor结合远程API形式的智能化自动编程，另一种方案是VSCode插件结合本

快捷键

人工智能

API

原创精选 1月前 178 阅读

大模型工具KTransformer的安装

本文主要介绍的是国产高性能大模型加载工具KTransformer的安装方法。之所以是使用方法，是因为该工具对本地的硬件条件还是有一定

git

XS

python

原创精选 1月前 578 阅读

DeepSeek+PageAssist实现本地大模型联网

这篇文章主要介绍了通过使用PageAssist，来使得本地部署的DeepSeek模型可以联网搜索的方案。技术背景在前面的几篇博客中，我们分别介绍过在Ubuntu上部署DeepSeek、在Windows上部署DeepSeek、使用AnythingLLM构建本地知识库的方法，其中还包含了ChatBox的基本安装和使用。这里我们要介绍的是PageAssist，一

搜索

百度

任务栏

原创精选 1月前 1135 阅读 1收藏

DeepSeek部署本地知识库

大模型之大，可以训练我们所有人日常生活学习工作可能使用到的所有知识。但是完整的大模型，要实现一个本地

工作区

上传

Windows

原创精选 1月前 380 阅读 1点赞 1收藏

Ubuntu Linux部署DeepSeek

本文介绍了通过Ollama在Ubuntu Linux平台上部署DeepSeek本地大模型的方法，并且可以使用ChatBox调用本地Ollam

API

本地文件

sed

原创精选 1月前 942 阅读

Windows11本地部署DeepSeek加速

本文介绍了一个可以相比之下更快速的在本地部署DeepSeek的方法，除了在上一篇博客中介绍的从Github或者Github加速网

自定义

Ubuntu

配置文件

原创精选 1月前 519 阅读

Markdown转Beamer进阶

接上一篇介绍的基本Markdown通过pandoc编译转为Beamer风格文档的文章，本文主要介绍一些Markdown转Beamer其中的

Markdown

流程图

伪代码

原创精选 1月前 166 阅读

使用SpongeExt快捷完成CudaSPONGE结合PySAGES的增强采样

基于CudaSPONGE高性能分子动力学模拟采样工具，和PySAGES高性能增强采样软件

python

封装

ide

原创 1月前 28 阅读

CudaSPONGE与PySAGES初步性能测试

接前一篇关于PySAGES结合CudaSPONGE使用方法的文章，本文主要还是使用了一样的测试案例。仅通过不同的测试步长，来定

性能测试

数据

CUDA

原创精选 1月前 160 阅读

Markdown转Beamer

通过使用pandoc，使得我们可以直接将普通的Markdown文件编译成一个Latex Beamer PDF格式的演示

Markdown

RMarkdown

Regular

原创精选 2月前 194 阅读

PySAGES结合CUDA SPONGE增强采样

本文探索并梳理了一下CUDA SPONGE高性能分子模拟采样软件，和PySAGES高性能增强采样软件，这两者强强联合的MD模

CUDA

Python

ide

原创精选 2月前 208 阅读

PCA主成分分析的Python实现

接上一篇文章介绍的矩阵特征分解，本文介绍了矩阵特征分解在主成分分析（PCA）算法中的应用。对于PCA算法，最直观的理解就是，在高维数据中找到一个低维的空间，使得所有的数据点投影到该低维空间之后尽可能的分离。

数据

Python

特征值

原创精选 3月前 187 阅读

Numpy本征值求解

本文介绍了一下使用Numpy计算矩阵的特征值求解和特征值分解问题。Numpy的eig特征求解函数可以直接输出给定矩阵

特征值

Python

奇异值分解

原创 3月前 42 阅读

PySAGES实记

本文主要介绍了增强采样外接软件PySAGES的基本安装和使用方法，重点是安装过程中没有写清楚的一些环境依赖和可能出现的问题介绍，以及相应的解决方案。并简单的梳理了一下PySAGES软件的工作流机制，其能够做到Zero Copy，并使得Enhanced Sampling不再成为很多模拟的Bottleneck，这是一个相当出色的结果。技术背景PySAGES是一

python

git

github

原创 3月前 72 阅读

CudaSPONGE之Python接口

本文介绍了高性能GPU分子动力学模拟软件CudaSPONGE的Python API接口，通过官方开发的prips插件，使得我们可以在Python框架下很方便的开

python

Python

动态链接库

原创 3月前 29 阅读

Jax Jit模式下的Array输出

本文仅介绍一个可以在Jax的Jit即时编译模式下，也能够正常通过print打印函数来输出Jax Array内容的方法。

数组

html

应用场景

原创 3月前 54 阅读

解决MindSpore-2.4-GPU版本的安装问题

本文介绍了在Ubuntu-20.04系统下安装最新的Mind

python

bc

linux

原创 4月前 282 阅读

MindSpore-2.4版本中的一些新特性

接上一篇对于MindSpore-2.4-gpu版本的安装介绍，本文主要介绍一些MindSpore-2.4版本中的新特性，例如使用hal对设备和流进行管理，进而支持Stream流计算。另外还有类似于Jax中的fori_loop方法，MindSpore最新版本中也支持了ForiLoop循环体，使得循环的执行更加高效，也是端到端自动微分的强大利器之一。

流计算

python

新版本

原创 4月前 32 阅读

OpenMM的安装与使用

python

linux

bc

原创 4月前 34 阅读

Conda环境Git Pull报错

本文总结了一个在conda环境下使用git pull出现报错：symbol lookup error: /lib/x86_64-linux-gnu/libp11-kit.so

linux

git

动态链接库

原创 4月前 219 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

wx6239978789cac的博客

KTransformers实战DeepSeek-R1-1.58bit量化模型

Cython与CUDA之BatchGather

DeepSeek满血版测试

bin格式转safetensors

CUDA异常捕获

CUDA时长统计

Cython与CUDA之Gather

DeepSeek本地性能调优

Ollama模型迁移

DeepSeek模型量化

DeepSeek智能编程

大模型工具KTransformer的安装

DeepSeek+PageAssist实现本地大模型联网

DeepSeek部署本地知识库

Ubuntu Linux部署DeepSeek

Windows11本地部署DeepSeek加速

Markdown转Beamer进阶

使用SpongeExt快捷完成CudaSPONGE结合PySAGES的增强采样

CudaSPONGE与PySAGES初步性能测试

Markdown转Beamer

PySAGES结合CUDA SPONGE增强采样

PCA主成分分析的Python实现

Numpy本征值求解

PySAGES实记

CudaSPONGE之Python接口

Jax Jit模式下的Array输出

解决MindSpore-2.4-GPU版本的安装问题

MindSpore-2.4版本中的一些新特性

OpenMM的安装与使用

Conda环境Git Pull报错

欢迎