最新资讯

  • 混合专家模型MoE的全面指南(二)路由机制、负载均衡

混合专家模型MoE的全面指南(二)路由机制、负载均衡

2025-04-27 18:37:43 0 阅读

三、路由机制

既然我们有了这么一帮专家,那模型咋知道该用哪个专家呢?在专家前面加了个门控网络,它会学着挑出给定词用哪个专家。

1、路由器

路由器(门控网络)也是前馈神经网络,根据特定输入来选专家。它会输出概率,用这些概率来挑出最匹配的专家:

专家层会返回选中的专家的输出乘以门控值(选择概率)。

路由器加上专家(只选几个)就组成了专家混合(MoE)层:

一个MoE层有两种尺寸,要么是稀疏的,要么是密集的专家混合。

两者都用路由器选专家,但稀疏MoE只挑几个,密集MoE虽然全选,但可能按不同分布来选。

比如,给定一串词,MoE会把词分给所有专家,而稀疏MoE就只挑几个专家。

在目前大型语言模型(LLM)的状况下,看到‘MoE’一般指稀疏MoE,因为它能用专家的一个子集。这样计算成本低,对大型语言模型来说很重要。

2、专家的选择

门控网络可以说是专家混合(MoE)里最重要的部分,因为它不仅决定了推理时用哪些专家,训练时也一样。

最基础的形式下,我们把输入(x)和路由器的权重矩阵(W)相乘:

然后,对输出应用 SoftMax 函数,为每个专家生成一个概率分布

路由器用这个概率分布来挑出给定输入最适合的专家。

最后,我们把每个路由器的输出和每个选中的专家的输出相乘,再把结果加起来。

咱们把所有步骤串起来,看看输入是怎么通过路由器和专家的:

3、路由的复杂性

不过,这个简单的函数常常会导致路由器总是选同一个专家,因为有些专家可能学得比其他专家快:

这不仅会导致专家选择的分布不均,还会使一些专家几乎不被训练,从而在训练和推理过程中引发问题。

为了解决这个问题,我们希望在训练和推理过程中,所有专家都能得到平等的重视,这被称为负载均衡。这样可以防止模型过度依赖少数几个专家,从而避免过拟合。

四、负载均衡

为了平衡专家的重要性,我们需要关注路由器,因为它是决定在特定时间选择哪些专家的主要组件。

1、KeepTopK

一种负载均衡路由器的方法是通过一个简单的扩展,称为 KeepTopK。通过引入可训练的高斯噪声,有助于打破对特定专家的偏好,使选择更加随机化,这样我们可以防止总是选择相同的专家:

然后,除了你想要激活的顶部 k 个专家(例如 2 个)之外,其他专家的权重会被设置为 −∞:

通过将这些权重设置为 −∞,SoftMax 函数在这些权重上的输出将导致概率为 0:

SoftMax 函数的性质: SoftMax 函数将一个向量转换为概率分布,每个元素的值在 0 和 1 之间,且所有元素的和为 1。 SoftMax 函数的公式为:

其中,是输入向量,是向量的长度,是向量的第 个元素。 设置权重为 :

当某个元素的值为 时,的值为 0。

因此,对于任何包含的向量,SoftMax 函数将这些元素的输出概率设置为 0。 具体步骤

假设我们有中间向量 ,其中某些元素被设置为:

应用 SoftMax 函数:

具体计算:由于e^{-infty} = 0,上述表达式简化为: ext{SoftMax}(math

计算具体值: ext{SoftMax}(mathbf{z}_{ ext{top-k}}) = left, rac{1.6487}{1.6487 + $2.22$55}, 0, rac{2.2255}{1.6487 + 2.2255}, 0 ight] = left[ 0, 0.4256, 0,0.5744, 0 ight]

结果

通过将权重设置为 ,SoftMax 函数确保了这些专家的激活概率为 0,从而只激活顶部 个专家。

优点

负载均衡: 确保每个专家都有机会被激活,避免某些专家过度使用而其他专家闲置。

防止过拟合: 通过引入噪声,防止模型过度依赖少数几个专家,从而提高模型的泛化能力。

灵活性: 可以根据具体需求调整的值,灵活控制专家的选择数量。

KeepTopK 策略是许多大型语言模型(LLM)仍在使用的一种方法,尽管有许多有前景的替代方案。需要注意的是,KeepTopK 也可以在不添加额外噪声的情况下使用。

Token Choice

KeepTopK 策略将每个词路由到几个选定的专家。这种方法称为 Token Choice,允许给定的词被发送到一个专家(top-1 路由)或多个专家(top-k 路由)。

或者发送到多个专家(top-k 路由):

辅助损失

一个主要的好处是,它允许对各个专家的贡献进行加权和整合。

为了在训练过程中实现专家的更均匀分布,辅助损失(也称为负载均衡损失)被添加到了网络的常规损失中。

它增加了一个约束,迫使专家具有相等的重要性。 这个辅助损失的第一个组成部分是在整个批次中对每个专家的路由器值进行求和:

这为我们提供了每个专家的重要性分数,这些分数表示无论输入是什么,给定专家被选中的可能性。

我们可以利用这些分数来计算变异系数(CV),它告诉我们专家之间的重要性分数的差异程度。

例如,如果重要性分数差异很大,变异系数(CV)将会很高:

相反,如果所有专家的重要性分数相似,变异系数(CV)将会很低(这是我们所期望的):

利用这个 CV 分数,我们可以在训练过程中更新辅助损失,使其尽可能降低 CV 分数(从而给予每个专家相等的重要性):

最后,辅助损失作为单独的损失在训练过程中进行优化。

2、专家容量

不平衡不仅存在于被选择的专家中,还存在于发送到专家的令牌分布中。

例如,如果输入令牌不成比例地发送到一个专家而不是另一个专家,这可能会导致训练不足。

这里,问题不仅仅在于使用了哪些专家,还在于对它们的使用程度。

一个解决方案是限制给定专家可以处理的令牌数量,即专家容量(Expert Capacity)。当一个专家达到其容量时,后续的令牌将被发送给下一位专家。

如果两个专家都达到容量了,这个词就不会被任何专家处理,而是直接送到下一层。这就叫做词溢出。

简单来说,就好比有两个专家在处理任务,但他们都忙不过来了,手上的活儿已经堆得满满的。这时候再来的新任务,他们就没办法处理了,只能把这个任务往后传,让下一层的专家或者别的机制来处理。这就叫词溢出。

3、用 Switch Transformer 简化 MoE

最早解决 MoE 训练不稳定性问题(如负载均衡)的基于 Transformer 的 MoE 模型之一是 Switch Transformer。它极大地简化了架构和训练过程,同时提高了训练的稳定性。

Switch Transformer

Switch Transformer 是 Google 在 2022 年发表的一篇论文中提出的一种模型,它简化了 MoE 的路由算法,减少了计算量和通信量,同时支持 bfloat16 精度进行训练。基于 T5-Base 和 T5-Large 设计的模型在相同的算力下训练速度提升了 7 倍;同时发布了 1.6 万亿参数的 MoE 模型,相比 T5-XXL 模型训练速度提升了 4 倍。

模型介绍

Switch Transformer 是一个 T5 模型(编码器-解码器),它用切换层替换了传统的前馈神经网络层。切换层是一个稀疏的 MoE 层,它为每个词元选择一个专家(Top-1 路由)。

简化稀疏路由

在传统的 MoE 层中,网络接收一个输入词元 ,输出会路由到 top-K 个专家进行计算。Switch Transformer 采用了一种简化的路由策略,即每次只发给一个专家,这样可以显著减少路由的计算量,同时保证模型的性能。

高效稀疏路由

Switch Transformer 通过以下方式实现高效稀疏路由:

路由计算量减少: 只有一个专家被激活,减少了计算量。

专家容量减半: 专家中的 batch_size 至少减半,进一步减少了计算量。

简化路由实现: 减少了传统 MoE 方法中通信的代价。

分布式 Switch 实现

Switch Transformer 的分布式实现中,所有核心被分配给数据分区维度 ,这也对应于模型中的专家数量。对于每个核心的每个词元,路由器会本地计算分配给专家的分配。输出是一个大小为 的二进制矩阵,该矩阵在第一维度上进行分区,并确定专家的分配。

负载均衡损失

为了促使每个专家都可以拿到近似均匀分布的样本,Switch Transformer 引入了负载均衡损失。 当 时,损失是最小的。

切换层

Switch Transformer 是一个 T5 模型(编码器-解码器),它用切换层替换了传统的前馈神经网络层。切换层是一个稀疏的 MoE 层,它为每个词元选择一个专家(Top-1 路由)。

简单来说,就是路由器在挑专家的时候,就是按照老规矩来,把输入数据和专家的权重相乘,然后用 SoftMax 函数处理一下,看看哪个专家最合适。没有啥复杂的操作,就是常规操作。

Switch Transformer 用了一种很简单的办法 来挑专家。以前的方法是让每个词元找好几个专家来处理,这种方法叫 top-k 路由。但 Switch Transformer 说,其实每个词元找一个专家就足够了,这种方法叫 top-1 路由。这样做的好处是,计算量变小了,通信成本也降低了,而且训练起来更稳定。

容量因子

容量因子就像是给每个专家分配任务的“额度”。这个值很重要,因为它决定了每个专家能处理多少个词元。Switch Transformer 在这方面做了改进,通过直接调整容量因子来控制每个专家的处理能力。这样做的好处是,可以更好地平衡每个专家的负载,避免有些专家忙不过来,而有些专家却很闲。

tokens per batch: 每个批次中的令牌总数。

number of experts: 专家的数量。

capacity factor: 容量因子,通常大于 1,以提供额外的缓冲空间。

专家容量的组成部分其实挺简单的。专家容量主要由两个因素决定:每个批次中的令牌数量和专家的数量。

如果我们把容量因子调大,每个专家就能处理更多的词元。这听起来好像挺好的,因为专家们能干更多的活儿。

但是,如果把这个因子调得太大,就会浪费很多计算资源,因为有些专家可能会闲着没事干。反过来,如果容量因子太小,专家们就会忙不过来,处理不了所有的词元,这就叫令牌溢出。结果就是,模型的性能会变差,因为有些词元没被处理好。所以,容量因子得找个合适的值,这样才能让专家们既不过载,也不闲置,模型性能也能保持在最佳状态。

辅助损失

辅助损失这个东西,就是为了防止模型在处理数据时丢掉一些重要的信息。想象一下,每个专家都有自己的工作量,我们希望这些工作量分配得均匀一些。为了达到这个目的,我们引入了一个简化的辅助损失函数。

这个辅助损失函数不是去计算那些复杂的变异系数,而是直接看每个专家被分配到的令牌比例和路由器预测的概率。具体来说,我们希望每个专家处理的令牌数量和它们被选中的概率都差不多,也就是每个专家都能均匀地分到活儿干。

α 这个超参数就像是一个调节旋钮,用来控制这个辅助损失在训练过程中的重要性。如果 α 值设得太高,辅助损失就会太强势,把主要的损失函数都盖过去了;如果 α 值太低,那这个辅助损失就起不到什么作用,专家们的工作量还是不平衡。所以,α 值需要好好调整,才能让模型既不丢信息,又能让每个专家都忙得过来。


如何系统学习掌握AI大模型?

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 2024行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费

本文地址:https://www.vps345.com/3717.html

搜索文章

Tags

PV计算 带宽计算 流量带宽 服务器带宽 上行带宽 上行速率 什么是上行带宽? CC攻击 攻击怎么办 流量攻击 DDOS攻击 服务器被攻击怎么办 源IP 服务器 linux 运维 游戏 云计算 进程 操作系统 进程控制 Ubuntu ssh deepseek Ollama 模型联网 API CherryStudio python MCP llama 算法 opencv 自然语言处理 神经网络 语言模型 数据库 centos oracle 关系型 安全 分布式 javascript 前端 chrome edge react.js 前端面试题 node.js 持续部署 Dell R750XS 科技 ai java 人工智能 个人开发 harmonyos 华为 开发语言 typescript 计算机网络 ubuntu numpy 阿里云 网络 网络安全 网络协议 adb nginx 监控 自动化运维 笔记 C 环境变量 进程地址空间 macos ollama llm php android http ESP32 串口服务器 YOLO 深度学习 pytorch vue.js audio vue音乐播放器 vue播放音频文件 Audio音频播放器自定义样式 播放暂停进度条音量调节快进快退 自定义audio覆盖默认样式 nuxt3 vue3 面试 性能优化 jdk intellij-idea 架构 sql KingBase fastapi mcp mcp-proxy mcp-inspector fastapi-mcp agent sse 银河麒麟 kylin v10 麒麟 v10 LDAP spring boot websocket docker 实时音视频 filezilla 无法连接服务器 连接被服务器拒绝 vsftpd 331/530 kubernetes 容器 学习方法 经验分享 程序人生 gitlab c++ c语言 tcp/ip rust DeepSeek-R1 API接口 多线程服务器 Linux网络编程 json html5 firefox golang pycharm conda pillow spring django flask web3.py github 创意 社区 自动化 蓝耘科技 元生代平台工作流 ComfyUI RTSP xop RTP RTSPServer 推流 视频 kvm 无桌面 命令行 matlab YOLOv8 NPU Atlas800 A300I pro asi_bench ecm bpm zotero WebDAV 同步失败 代理模式 udp unity IIS .net core Hosting Bundle .NET Framework vs2022 vscode 代码调试 ipdb windows 远程连接 rdp 实验 远程工作 ssl 消息队列 tomcat Reactor 设计模式 C++ UOS 统信操作系统 yum 编辑器 oceanbase rc.local 开机自启 systemd 麒麟 媒体 机器学习 向日葵 kylin 深度优先 图论 并集查找 换根法 树上倍增 AI MNN DeepSeek Qwen 备份SQL Server数据库 数据库备份 傲梅企业备份网络版 chatgpt 大模型 llama3 Chatglm 开源大模型 web安全 大数据 hugo microsoft arm开发 gaussdb DeepSeek行业应用 Heroku 网站部署 xss 后端 AIGC AI编程 pppoe radius AI agent Docker Compose docker compose docker-compose java-ee react next.js 部署 部署next.js JAVA IDEA Java TRAE 国标28181 视频监控 监控接入 语音广播 流程 SIP SDP 机器人 googlecloud bash 小程序 弹性计算 虚拟化 KVM 计算虚拟化 弹性裸金属 idm redis jenkins 云原生 ci/cd 医疗APP开发 app开发 uni-app 学习 宝塔面板 同步 备份 建站 安全威胁分析 vscode 1.86 豆瓣 追剧助手 迅雷 nas 微信 内存 unity3d 目标检测 计算机视觉 https jvm aws ide 服务器繁忙 备选 网站 api 调用 示例 银河麒麟桌面操作系统 Kylin OS 国产化 Agent Dify postman mock mock server 模拟服务器 mock服务器 Postman内置变量 Postman随机数据 maven intellij idea 腾讯云 运维开发 报错 qt IIS服务器 IIS性能 日志监控 MQTT mosquitto 智能路由器 外网访问 内网穿透 端口映射 word图片自动上传 word一键转存 复制word图片 复制word图文 复制word公式 粘贴word图文 粘贴word公式 spring cloud sqlite dubbo TCP服务器 qt项目 qt项目实战 qt教程 openssl 密码学 fpga开发 shell 根服务器 debian kafka hibernate AI大模型 大模型入门 Deepseek 大模型教程 sqlserver Linux 国产操作系统 ukui 麒麟kylinos openeuler 微服务 统信 虚拟机安装 游戏程序 ffmpeg 音视频 git eureka mysql android studio ios flutter apache 孤岛惊魂4 恒源云 tcp oneapi open webui mongodb 博客 权限 excel 爬虫 Headless Linux 远程登录 telnet pdf asp.net大文件上传 asp.net大文件上传下载 asp.net大文件上传源码 ASP.NET断点续传 asp.net上传文件夹 asp.net上传大文件 .net core断点续传 华为认证 网络工程师 交换机 开源 电脑 live555 rtsp rtp visualstudio k8s c# zookeeper armbian u-boot GaN HEMT 氮化镓 单粒子烧毁 辐射损伤 辐照效应 嵌入式硬件 驱动开发 硬件工程 嵌入式实习 WSL win11 无法解析服务器的名称或地址 3d 数学建模 ftp 网络结构图 gitee stm32 单片机 ollama下载加速 Cline ecmascript nextjs reactjs URL 搜索引擎 HTML audio 控件组件 vue3 audio音乐播放器 Audio标签自定义样式默认 vue3播放音频文件音效音乐 自定义audio播放器样式 播放暂停调整声音大小下载文件 MI300x openwrt Docker Hub docker pull 镜像源 daemon.json ux 多线程 virtualenv arm LLM Web APP Streamlit svn string模拟实现 深拷贝 浅拷贝 经典的string类问题 三个swap 开发环境 SSL证书 Python 网络编程 聊天服务器 套接字 TCP 客户端 Socket 能力提升 面试宝典 技术 IT信息化 源码剖析 rtsp实现步骤 流媒体开发 Cursor odoo 服务器动作 Server action Flask FastAPI Waitress Gunicorn uWSGI Uvicorn prometheus 银河麒麟操作系统 rpc 远程过程调用 Windows环境 直播推流 vim 微信公众平台 C语言 ipython 物联网 重启 排查 系统重启 日志 原因 Hyper-V WinRM TrustedHosts pygame 小游戏 五子棋 联想开天P90Z装win10 jmeter 软件测试 C++软件实战问题排查经验分享 0xfeeefeee 0xcdcdcdcd 动态库加载失败 程序启动失败 程序运行权限 标准用户权限与管理员权限 僵尸进程 统信UOS bonding 链路聚合 mount挂载磁盘 wrong fs type LVM挂载磁盘 Centos7.9 MCP server C/S LLM windows日志 Linux PID 安全架构 游戏服务器 Minecraft ddos 数据集 cursor agi ansible playbook gpu算力 flash-attention 安装教程 GPU环境配置 Ubuntu22 CUDA PyTorch Anaconda安装 H3C 服务器无法访问 ip地址无法访问 无法访问宝塔面板 宝塔面板打不开 华为云 springsecurity6 oauth2 授权服务器 前后端分离 集成学习 集成测试 监控k8s集群 集群内prometheus html FunASR ASR 佛山戴尔服务器维修 佛山三水服务器维修 交互 go file server http server web server ruoyi 前端框架 hadoop 我的世界服务器搭建 asm selenium 测试工具 负载均衡 王者荣耀 Wi-Fi xpath定位元素 超融合 信息与通信 minio Spring Security 企业微信 Linux24.04 deepin 我的世界 我的世界联机 数码 HarmonyOS tidb GLIBC 缓存 鸿蒙 华为od ISO镜像作为本地源 postgresql 程序 群晖 云电竞 云电脑 todesk 视觉检测 proxy模式 NFS deepseek r1 jar BMC IPMI 带外管理 职场和发展 db 微信小程序 虚拟局域网 jetty undertow make命令 makefile文件 智能手机 NAS Termux Samba 显卡驱动 rabbitmq ruby express Kali 虚拟机 实习 iphone Erlang OTP gen_server 热代码交换 事务语义 c rclone AList webdav fnOS tcpdump ip ui 安卓 HarmonyOS Next 系统架构 wireshark 镜像 dify 远程桌面 wordpress 无法访问wordpess后台 打开网站页面错乱 linux宝塔面板 wordpress更换服务器 宝塔面板访问不了 宝塔面板网站访问不了 宝塔面板怎么配置网站能访问 宝塔面板配置ip访问 宝塔面板配置域名访问教程 宝塔面板配置教程 matplotlib jupyter pip unix 实战案例 鸿蒙系统 uv GPU 金仓数据库 2025 征文 数据库平替用金仓 ocr 思科模拟器 思科 Cisco IM即时通讯 QQ 剪切板对通 HTML FORMAT 虚幻 游戏引擎 navicat 线程 文件系统 路径解析 云服务 无人机 ROS 自动驾驶 压力测试 测试用例 功能测试 safari Mac 系统 kind AI写作 AI作画 聊天室 历史版本 下载 安装 nvidia 双系统 GRUB引导 Linux技巧 docker搭建nacos详解 docker部署nacos docker安装nacos 腾讯云搭建nacos centos7搭建nacos less KylinV10 麒麟操作系统 Vmware 其他 银河麒麟服务器操作系统 系统激活 devops 计算机外设 springboot远程调试 java项目远程debug docker远程debug java项目远程调试 springboot远程 5G 3GPP 卫星通信 信号处理 算力 visual studio code MacOS录屏软件 nac 802.1 portal Radius P2P HDLC camera Arduino 电子信息 mamba Vmamba muduo QT 5.12.12 QT开发环境 Ubuntu18.04 个人博客 X11 Xming HAProxy 数据库架构 数据管理 数据治理 数据编织 数据虚拟化 技能大赛 1024程序员节 系统安全 CH340 串口驱动 CH341 uart 485 iBMC UltraISO windwos防火墙 defender防火墙 win防火墙白名单 防火墙白名单效果 防火墙只允许指定应用上网 防火墙允许指定上网其它禁止 图像处理 elasticsearch 课程设计 EMQX 通信协议 ESXi GCC aarch64 编译安装 HPC laravel Linux无人智慧超市 LInux多线程服务器 QT项目 LInux项目 单片机项目 vue css Python基础 Python教程 Python技巧 wps grafana 直流充电桩 充电桩 junit SEO fd 文件描述符 mac bcompare Beyond Compare 漏洞 模拟器 教程 显示管理器 lightdm gdm ceph 树莓派 VNC 远程 命令 执行 sshpass 操作 阻塞队列 生产者消费者模型 服务器崩坏原因 list 模拟实现 AnythingLLM AnythingLLM安装 linux安装配置 Nuxt.js cocoapods xcode webrtc SSH Xterminal threejs 3D rnn SenseVoice netty 深度求索 私域 知识库 p2p 环境配置 Claude Qwen2.5-coder 离线部署 网络穿透 云服务器 游戏机 etcd 数据安全 RBAC frp 嵌入式 linux驱动开发 Netty 即时通信 NIO 腾讯云大模型知识引擎 HTTP 服务器控制 ESP32 DeepSeek seatunnel k8s资源监控 annotations自动化 自动化监控 监控service 监控jvm wsl AD域 反向代理 致远OA OA服务器 服务器磁盘扩容 jina yolov8 okhttp CORS 跨域 中兴光猫 换光猫 网络桥接 自己换光猫 rag ragflow ragflow 源码启动 技术共享 ArkUI 多端开发 智慧分发 应用生态 鸿蒙OS ue4 着色器 ue5 zabbix can 线程池 vasp安装 查询数据库服务IP地址 SQL Server 加解密 Yakit yaklang 语音识别 AutoDL apt mariadb 开机自启动 HCIE 数通 业界资讯 cuda cudnn anaconda 模拟退火算法 ssh远程登录 code-server SVN Server tortoise svn r语言 数据挖掘 数据可视化 数据分析 SysBench 基准测试 linux上传下载 计算机 程序员 鲲鹏 昇腾 npu 健康医疗 互联网医院 单元测试 MS Materials eclipse gateway Clion Nova ResharperC++引擎 Centos7 远程开发 kamailio sip VoIP vmware 卡死 大数据平台 银河麒麟高级服务器 外接硬盘 Kylin 图形化界面 中间件 换源 国内源 Debian gradle 浏览器开发 AI浏览器 lio-sam SLAM AISphereButler crosstool-ng Java Applet URL操作 服务器建立 Socket编程 网络文件读取 yaml Ultralytics 可视化 Dell HPE 联想 浪潮 rust腐蚀 npm wsl2 框架搭建 etl .net tensorflow 回显服务器 UDP的API使用 HiCar CarLife+ CarPlay QT RK3588 vSphere vCenter Node-Red 编程工具 流编程 springboot selete 高级IO 升级 CVE-2024-7347 VPS .net mvc断点续传 多层架构 解耦 温湿度数据上传到服务器 Arduino HTTP 需求分析 规格说明书 bat openEuler rocketmq web 服务器管理 配置教程 服务器安装 网站管理 雨云 NPS redhat 飞书 微信分享 Image wxopensdk web3 linux 命令 sed 命令 autodl Linux awk awk函数 awk结构 awk内置变量 awk参数 awk脚本 awk详解 软件定义数据中心 sddc 矩阵 big data Linux的基础指令 大模型微调 工业4.0 IMM rtsp服务器 rtsp server android rtsp服务 安卓rtsp服务器 移动端rtsp服务 大牛直播SDK 信号 echarts IMX317 MIPI H265 VCU composer 传统数据库升级 银行 大语言模型 LLMs 单一职责原则 IPMITOOL 硬件管理 opcua opcda KEPServer安装 小艺 Pura X token sas 小智AI服务端 xiaozhi TTS FTP 服务器 Typore gitea hexo 移动云 可信计算技术 僵尸世界大战 游戏服务器搭建 数据结构 编程 性能分析 nfs SSL 域名 rsyslog Anolis nginx安装 环境安装 linux插件下载 硬件架构 VR手套 数据手套 动捕手套 动捕数据手套 v10 软件 毕昇JDK webstorm Trae IDE AI 原生集成开发环境 Trae AI 策略模式 单例模式 mcu 交叉编译 实时互动 SWAT 配置文件 服务管理 网络共享 CPU 主板 电源 网卡 项目部署到linux服务器 项目部署过程 边缘计算 本地部署 网络攻击模型 微信小程序域名配置 微信小程序服务器域名 微信小程序合法域名 小程序配置业务域名 微信小程序需要域名吗 微信小程序添加域名 半虚拟化 硬件虚拟化 Hypervisor EasyConnect 7z n8n 工作流 workflow Kali Linux 黑客 渗透测试 信息收集 Linux环境 h.264 micropython esp32 mqtt 输入法 av1 电视盒子 机顶盒ROM 魔百盒刷机 RustDesk自建服务器 rustdesk服务器 docker rustdesk 黑客技术 流式接口 网工 opensearch helm ssrf 失效的访问控制 pgpool Windows vscode1.86 1.86版本 ssh远程连接 田俊楠 SSE open Euler dde .netcore IPv4 子网掩码 公网IP 私有IP SSH 密钥生成 SSH 公钥 私钥 生成 outlook iperf3 带宽测试 软链接 硬链接 WebUI DeepSeek V3 TrinityCore 魔兽世界 ShenTong sysctl.conf vm.nr_hugepages adobe elk bug 合成模型 扩散模型 图像生成 环境迁移 视频编解码 流水线 脚本式流水线 efficientVIT YOLOv8替换主干网络 TOLOv8 Ubuntu 24.04.1 轻量级服务器 python3.11 dash 正则表达式 文件分享 软件工程 iis W5500 OLED u8g2 CrewAI chfs ubuntu 16.04 log4j 相差8小时 UTC 时间 远程控制 远程看看 远程协助 sentinel Xinference RAGFlow cpu 实时 使用 高效日志打印 串口通信日志 服务器日志 系统状态监控日志 异常记录日志 毕设 DevEco Studio OpenHarmony 真机调试 FTP服务器 VMware安装mocOS VMware macOS系统安装 sdkman VMware安装Ubuntu Ubuntu安装k8s OD机试真题 华为OD机试真题 服务器能耗统计 ros dns AI-native Docker Desktop 低代码 WSL2 三级等保 服务器审计日志备份 prometheus数据采集 prometheus数据模型 prometheus特点 相机 DigitalOcean GPU服务器购买 GPU服务器哪里有 GPU服务器 智能音箱 智能家居 多个客户端访问 IO多路复用 TCP相关API gcc bootstrap 软考 k8s集群资源管理 云原生开发 XCC Lenovo 压测 ECS 繁忙 解决办法 替代网站 汇总推荐 AI推理 CDN g++ g++13 dba Ubuntu 24 常用命令 Ubuntu 24 Ubuntu vi 异常处理 烟花代码 烟花 元旦 mysql离线安装 ubuntu22.04 mysql8.0 源码 毕业设计 tailscale derp derper 中转 线性代数 电商平台 Ubuntu DeepSeek DeepSeek Ubuntu DeepSeek 本地部署 DeepSeek 知识库 DeepSeek 私有化知识库 本地部署 DeepSeek DeepSeek 私有化部署 大文件分片上传断点续传及进度条 如何批量上传超大文件并显示进度 axios大文件切片上传详细教 node服务器合并切片 vue3大文件上传报错提示错误 大文件秒传跨域报错cors dity make centos-root /dev/mapper yum clean all df -h / du -sh 考研 onlyoffice 在线office DOIT 四博智联 防火墙 NAT转发 NAT Server Unity Dedicated Server Host Client 无头主机 stm32项目 embedding hive Hive环境搭建 hive3环境 Hive远程模式 webgl glibc 常用命令 文本命令 目录命令 thingsboard LORA NLP ardunio BLE 端口测试 iDRAC R720xd 命名管道 客户端与服务端通信 chrome 浏览器下载 chrome 下载安装 谷歌浏览器下载 freebsd prompt dell服务器 iventoy VmWare OpenEuler css3 epoll XFS xfs文件系统损坏 I_O error es 抗锯齿 cnn GoogLeNet 磁盘监控 MySql iot cd 目录切换 USB转串口 飞牛NAS 飞牛OS MacBook Pro harmonyOS面试题 邮件APP 免费软件 服务器主板 AI芯片 Ubuntu Server Ubuntu 22.04.5 移动魔百盒 docker run 数据卷挂载 交互模式 Open WebUI DNS UDP 服务器时间 langchain deep learning 具身智能 强化学习 游戏开发 dock 加速 政务 分布式系统 监控运维 Prometheus Grafana 链表 Redis Desktop 本地知识库部署 DeepSeek R1 模型 RoboVLM 通用机器人策略 VLA设计哲学 vlm fot robot 视觉语言动作模型 硬件 设备 PCI-Express VMware创建虚拟机 ai小智 语音助手 ai小智配网 ai小智教程 智能硬件 esp32语音助手 diy语音助手 sqlite3 音乐服务器 Navidrome 音流 ping++ 粘包问题 linux环境变量 信创 信创终端 中科方德 iftop 网络流量监控 大模型推理 大模型学习 gpt-3 文心一言 搭建个人相关服务器 rustdesk 人工智能生成内容 金融 网络用户购物行为分析可视化平台 大数据毕业设计 dns是什么 如何设置电脑dns dns应该如何设置 minicom 串口调试工具 在线预览 xlsx xls文件 在浏览器直接打开解析xls表格 前端实现vue3打开excel 文件地址url或接口文档流二进 车载系统 序列化反序列化 架构与原理 拓扑图 docker搭建pg docker搭建pgsql pg授权 postgresql使用 postgresql搭建 Attention docker命令大全 项目部署 Deepseek-R1 私有化部署 推理模型 欧标 OCPP ip命令 新增网卡 新增IP 启动网卡 edge浏览器 物联网开发 lua 怎么卸载MySQL MySQL怎么卸载干净 MySQL卸载重新安装教程 MySQL5.7卸载 Linux卸载MySQL8.0 如何卸载MySQL教程 MySQL卸载与安装 clickhouse vue-i18n 国际化多语言 vue2中英文切换详细教程 如何动态加载i18n语言包 把语言json放到服务器调用 前端调用api获取语言配置文件 RAID RAID技术 磁盘 存储 社交电子 高效远程协作 TrustViewer体验 跨设备操作便利 智能远程控制 RAGFLOW RAG 检索增强生成 文档解析 大模型垂直应用 PX4 域名服务 DHCP 符号链接 配置 音乐库 飞牛 实用教程 软负载 多进程 midjourney 裸金属服务器 弹性裸金属服务器 eNSP 网络规划 VLAN 企业网络 大模型面经 kali 共享文件夹 基础环境 yum源切换 更换国内yum源 嵌入式Linux IPC Cookie 状态管理的 UDP 服务器 Arduino RTOS ubuntu20.04 开机黑屏 EMUI 回退 降级 gnu 匿名管道 Windsurf 沙盒 word seleium chromedriver 自动化测试 多路转接 USB网络共享 springcloud Playwright EtherNet/IP串口网关 EIP转RS485 EIP转Modbus EtherNet/IP网关协议 EIP转RS485网关 EIP串口服务器 灵办AI 执法记录仪 智能安全帽 smarteye 流量运营 trea idea mybatis YOLOv12 系统开发 binder framework 源码环境 元服务 应用上架 flink 信息可视化 网页设计 华为机试 数据库系统 ssh漏洞 ssh9.9p2 CVE-2025-23419 软件需求 C# MQTTS 双向认证 emqx 做raid 装系统 键盘 remote-ssh IO模型 AI代码编辑器 x64 SIGSEGV xmm0 trae llama.cpp CLion 火绒安全 firewalld 内网服务器 内网代理 内网通信 AI Agent 字节智能运维 EtherCAT转Modbus ECT转Modbus协议 EtherCAT转485网关 ECT转Modbus串口网关 EtherCAT转485协议 ECT转Modbus网关 VM搭建win2012 win2012应急响应靶机搭建 攻击者获取服务器权限 上传wakaung病毒 应急响应并溯源 挖矿病毒处置 应急响应综合性靶场 嵌入式系统开发 deekseek 代理服务器 curl wget 端口 查看 ss 剧本 docker部署翻译组件 docker部署deepl docker搭建deepl java对接deepl 翻译组件使用 DBeaver 数据仓库 kerberos uniapp RTMP 应用层 uni-file-picker 拍摄从相册选择 uni.uploadFile H5上传图片 微信小程序上传图片 状态模式 分析解读 Docker引擎已经停止 Docker无法使用 WSL进度一直是0 镜像加速地址 perf openstack Xen easyui 风扇控制软件 rpa 远程服务 TCP协议 conda配置 conda镜像源 产测工具框架 IMX6ULL 管理框架 VS Code 自动化任务管理 Logstash 日志采集 AD 域管理 spark HistoryServer Spark YARN jobhistory Linux find grep 大模型部署 网站搭建 serv00 grub 版本升级 扩容 开发 微信开放平台 微信公众号配置 飞牛nas fnos MacMini 迷你主机 mini Apple wpf milvus 宠物 免费学习 宠物领养 宠物平台 VSCode 服务器数据恢复 数据恢复 存储数据恢复 raid5数据恢复 磁盘阵列数据恢复 自定义客户端 SAS AP配网 AK配网 小程序AP配网和AK配网教程 WIFI设备配网小程序UDP开 服务器部署ai模型 vr 语法 磁盘镜像 服务器镜像 服务器实时复制 实时文件备份 java-rocketmq ldap ubuntu24.04.1 minecraft GIS 遥感 WebGIS 程序员创富 大大通 第三代半导体 碳化硅 ai工具 李心怡 pyqt 分布式训练 热榜 fast Kylin-Server 大模型应用 Linux的权限 内网环境 OpenSSH xshell termius iterm2 离线部署dify neo4j 数据库开发 database WebRTC gpt win服务器架设 windows server 迁移指南 docker部署Python 网卡的名称修改 eth0 ens33 keepalived sonoma 自动更新 cpp-httplib 服务网格 istio mm-wiki搭建 linux搭建mm-wiki mm-wiki搭建与使用 mm-wiki使用 mm-wiki详解 js xrdp SRS 流媒体 直播 SSH 服务 SSH Server OpenSSH Server chrome devtools ABAP 企业网络规划 华为eNSP ArcTS 登录 ArcUI GridItem arkUI hosts 崖山数据库 YashanDB 存储维护 NetApp存储 EMC存储 DenseNet Ark-TS语言 性能测试 雨云服务器 鸿蒙开发 移动开发 cmos 知识图谱 增强现实 沉浸式体验 应用场景 技术实现 案例分析 AR sequoiaDB 虚幻引擎 risc-v 捆绑 链接 谷歌浏览器 youtube google gmail DocFlow 图形渲染 ubuntu24 vivado24 黑苹果 swoole 办公自动化 自动化生成 pdf教程 Invalid Host allowedHosts CentOS 北亚数据恢复 oracle数据恢复 visual studio 自动化编程 干货分享 黑客工具 密码爆破 alias unalias 别名 Ubuntu共享文件夹 共享目录 Linux共享文件夹 西门子PLC 通讯 混合开发 JDK regedit 开机启动 ros2 moveit 机器人运动 上传视频至服务器代码 vue3批量上传多个视频并预览 如何实现将本地视频上传到网页 element plu视频上传 ant design vue vue3本地上传视频及预览移除 宕机切换 服务器宕机 影刀 #影刀RPA# 产品经理 MDK 嵌入式开发工具 论文笔记 sublime text arcgis lsb_release /etc/issue /proc/version uname -r 查看ubuntu版本 triton 模型分析 skynet 本地化部署 transformer 运维监控 京东云 LInux pyautogui 基础入门 wsgiref Web 服务器网关接口 PVE bot Docker rime leetcode 推荐算法 玩机技巧 软件分享 软件图标 阿里云ECS 代理 searxng 网络药理学 生物信息学 生信 PPI String Cytoscape CytoHubba 私有化 figma Unity插件 firewall CentOS Stream 服务器配置 蓝桥杯 Google pay Apple pay nlp Jellyfin TrueLicense