最新资讯

  • 零代码构建AI知识库:基于亮数据网页抓取API的维基百科数据自动化采集实战

零代码构建AI知识库:基于亮数据网页抓取API的维基百科数据自动化采集实战

2025-04-25 18:59:46 1 阅读

 1. 人工智能从算法驱动到知识驱动的进化

当前,以GPT-4、Claude等为代表的大语言模型(LLM)虽然展现出强大的生成能力,但其局限性也日益凸显:依赖历史训练数据导致知识滞后,面对专业领域问题时易产生“幻觉”(Hallucination),且缺乏对动态实时信息的响应能力。
为解决这些问题,AI技术正经历从“算法驱动”到“知识驱动”的范式升级。知识库(Knowledge Base) 成为连接通用大模型与垂直领域应用的桥梁:

  • 知识增强:通过RAG(检索增强生成)技术,将知识库中的结构化信息注入大模型输入,提升回答的可信度与专业性。
  • 动态更新:智能体(Agent)依赖知识库的持续更新实现长期记忆,例如金融领域Agent需实时整合股票行情、政策法规等数据以支持投资决策。
  • 降低算力成本:知识库可缓存高频查询结果,减少对大模型的重复调用。

2. 爬虫技术:概念与背景

2.1. 爬虫的定义与作用

网络爬虫,又称为网页蜘蛛、机器人或网络漫游器,是一种自动化脚本或程序,设计用于系统地浏览互联网并提取信息。爬虫的主要作用包括:

  • 信息收集:爬虫可以快速地从大量网站中收集数据,帮助用户获得所需的信息。
  • 搜索引擎优化:搜索引擎使用爬虫来抓取网页并索引内容,以便提供准确的搜索结果。
  • 市场分析:企业使用爬虫来监测竞争对手的动态、分析市场趋势和消费者行为。
  • 数据集构建:研究人员利用爬虫创建数据集以进行进一步的分析和模型训练。

2.2. 爬虫的工作原理

网络爬虫的工作流程通常包括以下几个步骤:

  1. 请求:爬虫向目标网站发送HTTP请求以获取网页内容。
  2. 响应:服务器响应请求并返回网页的HTML内容。
  3. 解析:爬虫使用解析器(如正则表达式、BeautifulSoup等)分析HTML,提取所需的信息。
  4. 存储:将提取的数据存储到数据库或文件中,以便后续处理和分析。

爬虫可以配置为定期更新数据,以确保信息的实时性和准确性。

2.3. 爬虫面临的挑战

在实际操作中,爬虫技术面临着多种挑战:

  • 反爬机制:许多网站使用技术手段检测和阻止爬虫访问,例如通过设置机器人排除协议(robots.txt)或使用CAPTCHA验证。
  • IP封禁:当同一IP地址频繁访问网站时,可能会被视为恶意行为而遭到封禁。使用代理IP轮换可以缓解这一问题。
  • 数据动态加载:一些网站使用JavaScript动态加载数据,爬虫需要支持JavaScript解析或使用浏览器自动化工具(如Selenium)来抓取这些数据。

2.4. 合法爬虫的边界与注意事项

在实施爬虫技术时,遵循法律和伦理标准至关重要:

  • 遵循robots.txt文件:尊重网站的robots.txt文件中规定的爬行规则和限制。
  • 避免过度抓取:控制爬虫的抓取频率和范围,以避免对目标网站造成不必要的负担。
  • 数据隐私:确保不侵犯用户隐私,不抓取敏感信息。
  • 合法使用数据:确保获取的数据用于合法和道德的目的,不用于侵犯版权或其他法律权利。

在实施爬虫技术时,始终保持透明度和责任感,以维护良好的互联网生态环境。

3. 传统爬虫技术

传统爬虫技术是数据采集领域中最基础的工具之一,通过编写简单的脚本即可实现数据抓取。然而,随着互联网技术的发展,传统爬虫逐渐暴露出其局限性。本章将深入探讨传统爬虫的技术栈、示例代码以及面临的痛点。

3.1. 传统爬虫的技术栈

传统爬虫通常使用Python编程语言,结合Requests库和BeautifulSoup库来实现数据抓取:

  • Python:以其简洁的语法和丰富的库支持成为爬虫开发的首选语言。
  • Requests库:用于发送HTTP请求并接收响应。它简化了网络通信,使开发者能够轻松地获取网页内容。
  • BeautifulSoup库:用于解析HTML和XML文档,提供便捷的方法来提取和处理网页中的数据。

这种技术栈适合于静态网页的抓取,易于学习和使用。

3.2. 使用亮数据代理ip爬取维基百科页面

接下来,我们一起来看下如何使用传统爬虫技术爬取维基百科,获取准确有价值的优质知识。

3.2.1. 维基百科关键词搜索api

GET https://en.wikipedia.org/w/api.php?action=query&list=search&srsearch={关键词}&srlimit={最大结果数}&format=json

{
  "batchcomplete": "",
  "continue": {
    "sroffset": 10,
    "continue": "-||"
  },
  "query": {
    "searchinfo": {
      "totalhits": 45,
      "suggestion": "人工智能n",
      "suggestionsnippet": "人工智能n"
    },
    "search": [
      {
        "ns": 0,
        "title": "DeepSeek",
        "pageid": 78452842,
        "size": 61495,
        "wordcount": 5930,
        "snippet": "organization Jevons paradox – Efficiency leads to increased demand Chinese: 杭州深度求索人工智能基础技术研究有限公司. Sometimes simply referred to in English as Hangzhou DeepSeek Artificial",
        "timestamp": "2025-03-25T02:01:11Z"
      },
      {
        "ns": 0,
        "title": "Artificial intelligence industry in China",
        "pageid": 57024219,
        "size": 87277,
        "wordcount": 7944,
        "snippet": "ISBN 978-981-19-8504-1 "【人民网】世界人工智能国际联合大会今秋将首次在中国举行----中国科学院". www.cas.cn. Archived from the original on 2023-05-04. Retrieved 2023-05-05. "科学网—首届吴文俊人工智能科学技术奖颁奖". news",
        "timestamp": "2025-03-13T21:04:04Z"
      },
      {
        "ns": 0,
        "title": "Generative artificial intelligence",
        "pageid": 73291755,
        "size": 163769,
        "wordcount": 13713,
        "snippet": "Archived from the original on July 27, 2023. Retrieved July 13, 2023. "生成式人工智能服务管理暂行办法". July 13, 2023. Archived from the original on July 27, 2023. Retrieved",
        "timestamp": "2025-03-22T15:24:03Z"
      },
      {
        "ns": 0,
        "title": "Alexandr Wang",
        "pageid": 75806942,
        "size": 10972,
        "wordcount": 920,
        "snippet": "你要知的8件事!創業6年25歲身家達10億美元成最年輕白手起家富翁". www.esquirehk.com. "DeepSeek:中國AI公司的驚人崛起帶來人工智能的「Sputnik時刻」還是「珍珠港事件」?". BBC News 中文 (in Traditional Chinese). January 28",
        "timestamp": "2025-03-03T16:04:26Z"
      },
      {
        "ns": 0,
        "title": "Beijing Academy of Artificial Intelligence",
        "pageid": 73400769,
        "size": 9766,
        "wordcount": 803,
        "snippet": "Beijing Academy of Artificial Intelligence (BAAI) (Chinese: 北京智源人工智能研究院; pinyin: Běijīng Zhìyuán réngōng zhìnéng yánjiùyuàn), also known as Zhiyuan Institute",
        "timestamp": "2025-01-01T19:02:51Z"
      },
      {
        "ns": 0,
        "title": "Interim Measures for the Management of Generative AI Services",
        "pageid": 74437860,
        "size": 7196,
        "wordcount": 825,
        "snippet": "Interim Measures for the Management of Generative AI Services (Chinese: 生成式人工智能服务管理暂行办法; pinyin: Shēngchéng shì réngōng zhìnéng fúwù guǎnlǐ zànxíng bànfǎ)",
        "timestamp": "2025-01-21T04:55:36Z"
      },
      {
        "ns": 0,
        "title": "Political repression",
        "pageid": 1297768,
        "size": 21504,
        "wordcount": 2283,
        "snippet": "Watch. 14 January 2020. Retrieved 2 March 2023. 孟宝勒 (2018-07-17). "中国的威权主义未来:人工智能与无孔不入的监控" (in Chinese). 纽约时报中文网. Archived from the original on 2019-10-16",
        "timestamp": "2025-02-28T17:24:22Z"
      },
      {
        "ns": 0,
        "title": "Kai-Fu Lee",
        "pageid": 2273087,
        "size": 31001,
        "wordcount": 2817,
        "snippet": "published February 2011, Beijing Xiron Books Co., Ltd) Artificial Intelligence (《人工智能》, published May 2017, Beijing Xiron Books Co., Ltd) AI 2041: Ten Visions",
        "timestamp": "2025-03-23T09:20:01Z"
      },
      {
        "ns": 0,
        "title": "Ted Chiang",
        "pageid": 325507,
        "size": 36433,
        "wordcount": 2738,
        "snippet": "Bibliography). Retrieved October 4, 2012. Klein, Ezra (March 3, 2023). "人工智能真正的恐怖之处" [The Imminent Danger of A.I. Is One We’re Not Talking About]. The",
        "timestamp": "2025-02-23T11:21:06Z"
      },
      {
        "ns": 0,
        "title": "VITAL (machine learning software)",
        "pageid": 63804242,
        "size": 19234,
        "wordcount": 1913,
        "snippet": "(PDF). Cadogan Consulting Group. Retrieved 6 May 2020. Lin, Shaowei (2018). "人工智能对公司法的影响:挑战与应对" [The impact of artificial intelligence on company law: challenges",
        "timestamp": "2024-04-23T00:00:38Z"
      }
    ]
  }
}

可以看到,人工智能的搜索结果有45条数据,但是我们设置了srlimit为10,所以API只给我们返回了10条,每条数据包含了百科标题等摘要性信息。

3.2.2. 爬取维基百科内容页内容

GET https://en.wikipedia.org/wiki/{空格替换为_后的title}

获取到网页内容之后,使用BeautifulSoup库解析网页源代码相关标签,得到需要的信息即可。

3.2.3. 获取亮数据代理ip

访问亮数据官网:购买住宅代理网络IP - 免费试用。点击开始免费试用按钮。

输入邮箱,点击创建账号按钮进行账号注册,然后登录网站。

登录成功后,点击左侧的Proxies & Scraping按钮。

找到住宅动态IP,点击开始使用按钮。

在基本设置里,找到通道名称,使用默认名称或者自己都可以。代理类型选共享(按GB收费),其它保持默认,然后点击右侧的添加按钮即可完成代理ip的设置。

代理ip配置成功后,可以看到账号、密码和ip获取域名、测试命令等信息,我们可以直接点击username:password@host:port右侧的复制按钮一键复制代理ip配置,下一步会用到。

3.2.4. 完整代码

以下是从维基百科搜索资料并进行爬取内容的完整代码。将开头的代理ip替换上一步一键复制的信息即可。

import requests
from bs4 import BeautifulSoup
import json

# 亮数据代理ip配置(需要替换为自己的用户名、密码)
proxy = {
    'http': '用户名:密码@brd.superproxy.io:33335',
}

class WikipediaScraper:
    def __init__(self, url):
        self.url = url
        self.headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
        }

    def scrape_page(self):
        try:
            response = requests.get(self.url, headers=self.headers,  timeout=5)
            response.raise_for_status()
            soup = BeautifulSoup(response.text, 'html.parser')
            
            title = soup.find('h1', {'id': 'firstHeading'}).text
            
            content = ''
            for paragraph in soup.find_all('p'):
                content += paragraph.text + '
'
            
            return {
                'title': title,
                'content': content.strip()
            }
        except requests.exceptions.RequestException as e:
            print(f'网络请求失败: {e}')
        except Exception as e:
            print(f'解析页面时出错: {e}')
        return None


class WikipediaKeywordSearch:
    def __init__(self, keyword):
        self.keyword = keyword
        self.headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
        }

    def search_articles(self, max_results=10):
        """通过Wikipedia API搜索包含关键字的文章"""
        url = f'https://en.wikipedia.org/w/api.php?action=query&list=search&srsearch={self.keyword}&srlimit={max_results}&format=json'
        
        try:
            response = requests.get(url, headers=self.headers, verify=False, timeout=10)
            response.raise_for_status()
            data = response.json()
            
            articles = []
            for result in data['query']['search']:
                article_url = f'https://en.wikipedia.org/wiki/{result["title"].replace(" ", "_")}'
                scraper = WikipediaScraper(article_url)
                page_content = scraper.scrape_page()
                
                articles.append({
                    'title': result['title'],
                    'url': article_url,
                    'content': page_content['content'] if page_content else ''
                })
            return articles
        except requests.exceptions.RequestException as e:
            print(f'搜索失败: {e}')
            return []

    def save_results(self, articles, file_name='wikipedia_search_results.json'):
        """保存搜索结果到JSON文件"""
        with open(file_name, 'w', encoding='utf-8') as f:
            json.dump(articles, f, ensure_ascii=False, indent=2)
        print(f'搜索结果已保存为 {file_name}')

if __name__ == '__main__':
    keyword = 'Artificial Intelligence'
    search = WikipediaKeywordSearch(keyword)
    articles = search.search_articles(max_results=10)
    if articles:
        search.save_results(articles)

如下所示,是爬虫爬取到的与人工智能相关的内容,包含了百科标题、网址和完整内容:

3.3. 传统爬虫的技术局限性

虽然传统爬虫技术在静态网页数据抓取中表现良好,但其局限性也显而易见:

  • 动态内容处理:传统爬虫无法直接处理JavaScript动态加载的内容,需要借助其他工具(如Selenium)来模拟浏览器行为。
  • 反爬策略:网站常常采用反爬策略如CAPTCHA验证、IP封禁等,传统爬虫难以绕过这些限制。
  • 数据量和效率:面对大规模数据需求时,传统爬虫的抓取速度和效率可能不足,需优化代码或采用分布式爬虫技术。
  • 维护和升级:随着网站结构的变化,爬虫代码需要频繁更新和维护,以确保数据抓取的准确性。

4. 亮数据网页抓取API:零代码网页抓取解决方案

4.1. 亮数据API的核心优势

亮数据的网页抓取API以零代码配置、全球网络支撑及动态渲染能力为核心,为企业与个人提供高效数据采集方案,具体优势如下:

  1. 无需编码:亮数据API允许用户通过可视化界面配置采集规则,无需编写复杂的代码。用户只需选择目标网站并设定抓取需求,API即可自动执行数据采集任务。这种简化的流程降低了技术门槛,使非技术人员也能参与数据抓取。
  2. 全球代理网络规避反爬限制:亮数据API集成了全球代理网络,能够有效规避IP封禁和其他反爬机制。通过智能代理切换,API可以模拟不同的地理位置和设备,提高数据采集的成功率和稳定性。
  3. 动态页面渲染支持(自动处理JavaScript):面对越来越多使用JavaScript动态加载内容的网站,亮数据API具备动态页面渲染支持。它能够自动处理JavaScript,确保动态内容的准确抓取。用户无需担心传统爬虫无法获取动态数据的问题。

4.2. 零代码实战:维基百科数据自动化采集

4.2.1. 选择爬取目标

访问亮数据官网:网页抓取工具 - 网页爬虫工具 - 免费试用。点击开始免费试用按钮。

输入邮箱,点击创建账号按钮进行账号注册,然后登录网站。

登录成功后,点击左侧的Web Scrapers按钮。

然后点击Web爬虫库,进入网络爬虫市场。

从网络爬虫市场中找到用于AI的数据,然后选择en.wikipedia.org。

继续找到Wikipedia articles - discover by keyword,也就是按关键字搜索的方式。

4.2.2. 网页爬取配置

选择无代码抓取器,点击下一个按钮。

到此,就真正进入了爬虫配置页面,可以看到,我们只需要配置关键词,其它的编码参数和细节亮数据都帮我们搞定并且隐藏起来了(可以切换到词典页查看抓取的信息都有哪些),非常简单。配置好关键字之后,点击右下角的Start collecting按钮,就会自动启动抓取任务了。

4.2.3. 数据下载

任务启动之后,重新回到Web Scrapers页面,等待刚才启动的任务状态变为Ready之后,点击进入任务详情。

可以看到,我们配置的这个爬虫运行了26秒,收集到了45条数据,数据量5.3MB。然后点击下载按钮,选择需要的格式即可将爬取的数据下载到本地了。

如下所示,是亮数据网页爬取API采集到的json格式数据,可以看到,比我们前面使用传统爬虫技术爬取到的数据量更多,知识更加优质!!

5. AI知识库的应用

AI知识库是智能系统的核心组成部分,通过收集、存储和组织大量数据,支持AI应用做出准确的决策和提供智能服务。以我们爬取的人工智能相关维基百科内容为例,这些信息可以通过智能体知识库发挥价值。

人工智能相关的维基百科内容涵盖广泛的知识,包括AI的基本概念、历史发展、技术应用、伦理问题等。这些信息可以被整合到智能体知识库中,支持智能体(如虚拟助手、聊天机器人等)提供更为丰富和准确的交互体验。

  • 知识查询与回答:智能体知识库利用维基百科的结构化信息,帮助智能体快速检索和提供准确的知识回答。例如,用户询问“什么是机器学习?”时,智能体能够从知识库中提取相关定义和应用实例进行解释。
  • 语境理解与推理:通过维基百科的内容,智能体知识库可以增强语境理解和推理能力。智能体能够结合上下文信息提供更有深度的回答,支持复杂问题的解答。
  • 持续更新与扩展:维基百科内容不断更新,智能体知识库可以实现动态更新,以保持与最新知识同步。这确保了智能体能够提供及时和准确的信息。

6. 高效的数据采集赋能AI快速发展

数据是驱动AI发展的核心要素。通过高效的数据采集方法,我们能够构建丰富的知识库,为AI应用提供强大的支持。亮数据的网页抓取API通过零代码方案大幅降低了数据采集的技术和人力成本。随着零代码方案的崛起,企业将能够更轻松地获取和利用数据,释放数据的潜在价值,推动AI应用的创新和发展。在未来,数据采集技术将继续演进,帮助我们更好地理解和利用数据,赋能各类AI应用场景。

好消息:点击链接注册新账号直接送$2美金,可以免费试用爬取动态代理和自动采集API功能!!!

本文地址:https://www.vps345.com/1028.html

搜索文章

Tags

PV计算 带宽计算 流量带宽 服务器带宽 上行带宽 上行速率 什么是上行带宽? CC攻击 攻击怎么办 流量攻击 DDOS攻击 服务器被攻击怎么办 源IP 服务器 linux 运维 游戏 云计算 ssh deepseek Ollama 模型联网 API CherryStudio 数据库 centos oracle 关系型 安全 分布式 python MCP llama 算法 opencv 自然语言处理 神经网络 语言模型 进程 操作系统 进程控制 Ubuntu javascript 前端 chrome edge harmonyos 华为 开发语言 typescript 计算机网络 ubuntu 阿里云 网络 网络安全 网络协议 经验分享 react.js 前端面试题 node.js 持续部署 科技 ai java 人工智能 个人开发 ollama llm php android nuxt3 vue3 笔记 C 环境变量 进程地址空间 银河麒麟 kylin v10 麒麟 v10 adb nginx 监控 自动化运维 json html5 firefox gitlab numpy c++ c语言 直播推流 Flask FastAPI Waitress Gunicorn uWSGI Uvicorn RTSP xop RTP RTSPServer 推流 视频 windows svn 联想开天P90Z装win10 自动化 蓝耘科技 元生代平台工作流 ComfyUI matlab YOLOv8 NPU Atlas800 A300I pro asi_bench http vscode ide fpga开发 github mount挂载磁盘 wrong fs type LVM挂载磁盘 Centos7.9 ecm bpm MCP server agent C/S LLM zotero WebDAV 同步失败 代理模式 agi AIGC 计算机视觉 macos Dify golang 后端 IIS .net core Hosting Bundle .NET Framework vs2022 华为云 物联网 YOLO 深度学习 pytorch uni-app AI 爬虫 数据集 websocket FunASR ASR tcp/ip web安全 pycharm 集成学习 集成测试 ssl 深度优先 图论 并集查找 换根法 树上倍增 Dell R750XS 串口服务器 postman mock mock server 模拟服务器 mock服务器 Postman内置变量 Postman随机数据 docker 容器 ESP32 AI agent java-ee udp IIS服务器 IIS性能 日志监控 react next.js 部署 部署next.js 网络结构图 mysql qt 多线程服务器 TCP服务器 qt项目 qt项目实战 qt教程 bash 小程序 JAVA IDEA Java 电脑 redis sql KingBase Cursor 安全威胁分析 fastapi mcp mcp-proxy mcp-inspector fastapi-mcp sse 豆瓣 追剧助手 迅雷 nas 微信 目标检测 spring boot LDAP 实时音视频 Docker Hub docker pull 镜像源 daemon.json Linux 架构 tomcat maven intellij idea conda pillow spring cloud intellij-idea kafka hibernate shell vim 重启 排查 系统重启 日志 原因 统信 国产操作系统 虚拟机安装 游戏程序 ffmpeg 音视频 git android studio ftp kubernetes 学习方法 程序人生 机器学习 MQTT 消息队列 Reactor 设计模式 性能优化 C++ rust DeepSeek-R1 API接口 远程登录 telnet pdf Linux网络编程 visualstudio kylin 银河麒麟操作系统 国产化 spring live555 rtsp rtp mongodb Hyper-V WinRM TrustedHosts apache flask HTML audio 控件组件 vue3 audio音乐播放器 Audio标签自定义样式默认 vue3播放音频文件音效音乐 自定义audio播放器样式 播放暂停调整声音大小下载文件 MI300x DeepSeek 面试 jdk 编辑器 开发环境 SSL证书 gpu算力 c# Windows 技术 css3 rpc 远程过程调用 Windows环境 sentinel 中间件 系统安全 历史版本 下载 安装 CPU 远程工作 高效日志打印 串口通信日志 服务器日志 系统状态监控日志 异常记录日志 jupyter 智能路由器 ansible 学习 前端框架 vsftpd 华为od OD机试真题 华为OD机试真题 服务器能耗统计 kvm 无桌面 命令行 gitea 媒体 微信公众平台 wsl 测试工具 嵌入式硬件 aws C语言 虚幻 游戏引擎 佛山戴尔服务器维修 佛山三水服务器维修 ipython 低代码 flutter 1024程序员节 iperf3 带宽测试 ArkUI 多端开发 智慧分发 应用生态 鸿蒙OS 加解密 Yakit yaklang jmeter 软件测试 gitee bootstrap html springboot远程调试 java项目远程debug docker远程debug java项目远程调试 springboot远程 web Socket microsoft jenkins 软考 黑客 计算机 中兴光猫 换光猫 网络桥接 自己换光猫 Agent 繁忙 服务器繁忙 解决办法 替代网站 汇总推荐 AI推理 CDN 大模型 https 统信UOS 麒麟 bonding 链路聚合 职场和发展 vue.js eureka 压力测试 tailscale derp derper 中转 fd 文件描述符 XCC Lenovo C++软件实战问题排查经验分享 0xfeeefeee 0xcdcdcdcd 动态库加载失败 程序启动失败 程序运行权限 标准用户权限与管理员权限 运维开发 IM即时通讯 QQ 企业微信 剪切板对通 HTML FORMAT 游戏服务器 Minecraft debian wps 安卓 ddos 防火墙 NAT转发 NAT Server ip embedding sqlserver AI-native Docker Desktop 搜索引擎 cursor SenseVoice windows日志 unity 数据挖掘 远程桌面 playbook selenium linux安装配置 thingsboard postgresql wsl2 LORA 大语言模型 NLP iDRAC R720xd r语言 freebsd glibc pip minio 服务器无法访问 ip地址无法访问 无法访问宝塔面板 宝塔面板打不开 嵌入式 linux驱动开发 arm开发 XFS xfs文件系统损坏 I_O error es jvm seatunnel 开源 kind iot elasticsearch AI编程 selete 高级IO springsecurity6 oauth2 授权服务器 前后端分离 go virtualenv 开机自启动 rag ragflow ragflow 源码启动 单片机 visual studio code 服务器主板 AI芯片 信息与通信 图像处理 3d 交互 file server http server web server vue css less 个人博客 openEuler 远程连接 rdp 实验 我的世界服务器搭建 腾讯云 asm 王者荣耀 Wi-Fi chatgpt ui HarmonyOS Next django unix 我的世界 我的世界联机 数码 鸿蒙 rtsp服务器 rtsp server android rtsp服务 安卓rtsp服务器 移动端rtsp服务 大牛直播SDK 代码调试 ipdb ruoyi 无人机 机器人 ISO镜像作为本地源 微服务 云原生 云电竞 云电脑 todesk 系统架构 db 微信小程序 智能手机 小艺 Pura X excel Linux无人智慧超市 LInux多线程服务器 QT项目 LInux项目 单片机项目 UOS 统信操作系统 yum oceanbase rc.local 开机自启 systemd 缓存 NAS Termux Samba express apt 国内源 备份SQL Server数据库 数据库备份 傲梅企业备份网络版 llama3 Chatglm 开源大模型 大数据 tensorflow 数据结构 HiCar CarLife+ CarPlay QT RK3588 Linux awk awk函数 awk结构 awk内置变量 awk参数 awk脚本 awk详解 gaussdb 负载均衡 银河麒麟桌面操作系统 Kylin OS xss 宝塔面板访问不了 宝塔面板网站访问不了 宝塔面板怎么配置网站能访问 宝塔面板配置ip访问 宝塔面板配置域名访问教程 宝塔面板配置教程 redhat ios pppoe radius hugo Netty 即时通信 NIO devops springboot 思科模拟器 思科 Cisco 群晖 audio vue音乐播放器 vue播放音频文件 Audio音频播放器自定义样式 播放暂停进度条音量调节快进快退 自定义audio覆盖默认样式 AI写作 AI作画 银河麒麟服务器操作系统 系统激活 实习 googlecloud stm32 远程 命令 执行 sshpass 操作 muduo 权限 Kali 虚拟机 国标28181 视频监控 监控接入 语音广播 流程 SIP SDP KylinV10 麒麟操作系统 Vmware 其他 idm prometheus k8s资源监控 annotations自动化 自动化监控 监控service 监控jvm windwos防火墙 defender防火墙 win防火墙白名单 防火墙白名单效果 防火墙只允许指定应用上网 防火墙允许指定上网其它禁止 根服务器 EMQX 通信协议 CUDA PyTorch GCC aarch64 编译安装 HPC 弹性计算 虚拟化 KVM 计算虚拟化 弹性裸金属 鸿蒙系统 junit SEO 漏洞 显示管理器 lightdm gdm .net 树莓派 VNC vscode 1.86 GaN HEMT 氮化镓 单粒子烧毁 辐射损伤 辐照效应 laravel Docker Compose docker compose docker-compose 交叉编译 5G 3GPP 卫星通信 需求分析 规格说明书 内存 健康医疗 互联网医院 DevEco Studio HarmonyOS OpenHarmony 真机调试 unity3d rabbitmq 网络穿透 云服务器 webrtc SSH Xterminal 备选 网站 api 调用 示例 课程设计 反向代理 pygame 小游戏 五子棋 sdkman filezilla 无法连接服务器 连接被服务器拒绝 331/530 vasp安装 查询数据库服务IP地址 SQL Server 语音识别 ci/cd AutoDL HCIE 数通 能力提升 面试宝典 IT信息化 mosquitto 外网访问 内网穿透 端口映射 SVN Server tortoise svn 程序员 mysql离线安装 ubuntu22.04 mysql8.0 sqlite 华为认证 网络工程师 交换机 dubbo openssl 密码学 eclipse 业界资讯 僵尸进程 客户端 log4j 大数据平台 hive Hive环境搭建 hive3环境 Hive远程模式 frp 硬件架构 kamailio sip VoIP 报错 webstorm ukui 麒麟kylinos openeuler rust腐蚀 can 线程池 flash-attention 驱动开发 chrome 浏览器下载 chrome 下载安装 mac 谷歌浏览器下载 jar WSL win11 无法解析服务器的名称或地址 回显服务器 UDP的API使用 vSphere vCenter Linux的基础指令 Java Applet URL操作 服务器建立 Socket编程 网络文件读取 armbian u-boot 鲲鹏 昇腾 npu 温湿度数据上传到服务器 Arduino HTTP linux上传下载 VMware安装Ubuntu Ubuntu安装k8s k8s zabbix web3.py 信号处理 升级 CVE-2024-7347 WSL2 孤岛惊魂4 web3 恒源云 tcp autodl big data 飞书 IMM sysctl.conf vm.nr_hugepages echarts etl adobe 传统数据库升级 银行 LLMs Linux24.04 deepin 博客 单一职责原则 Python 网络编程 聊天服务器 套接字 TCP 烟花代码 烟花 元旦 IPMITOOL BMC 硬件管理 oneapi 工业4.0 open webui Headless Linux n8n dity make dify deepseek r1 python3.11 计算机外设 asp.net大文件上传 asp.net大文件上传下载 asp.net大文件上传源码 ASP.NET断点续传 asp.net上传文件夹 asp.net上传大文件 .net core断点续传 iis 移动云 云服务 可信计算技术 nfs SSL 域名 rsyslog ruby 安装教程 GPU环境配置 Ubuntu22 Anaconda安装 IMX317 MIPI H265 VCU Trae IDE AI 原生集成开发环境 Trae AI 数据分析 硬件工程 嵌入式实习 主板 电源 网卡 抗锯齿 毕昇JDK 镜像 navicat DigitalOcean GPU服务器购买 GPU服务器哪里有 GPU服务器 多个客户端访问 IO多路复用 TCP相关API 监控k8s集群 集群内prometheus EasyConnect Cline ecmascript nextjs reactjs 黑客技术 本地部署 ssrf 失效的访问控制 openwrt MacOS录屏软件 Deepseek grafana ux 多线程 open Euler dde LLM Web APP Streamlit .netcore hadoop rclone AList webdav fnOS string模拟实现 深拷贝 浅拷贝 经典的string类问题 三个swap TrinityCore 魔兽世界 实时互动 数学建模 elk 网络攻击模型 向日葵 bug 策略模式 单例模式 ollama下载加速 模拟器 教程 Ubuntu 24.04.1 轻量级服务器 显卡驱动 文件分享 软件工程 W5500 OLED u8g2 odoo 服务器动作 Server action 医疗APP开发 app开发 tcpdump 安全架构 环境迁移 创意 社区 远程控制 远程看看 远程协助 safari Mac 系统 etcd 数据安全 RBAC 知识图谱 大模型教程 AI大模型 超融合 人工智能生成内容 金融 cpu 实时 使用 网络用户购物行为分析可视化平台 大数据毕业设计 IPv4 子网掩码 公网IP 私有IP 毕设 midjourney SSH 密钥生成 SSH 公钥 私钥 生成 离线部署dify 相差8小时 UTC 时间 rustdesk netty 实战案例 序列化反序列化 mcu 嵌入式Linux IPC risc-v eNSP 企业网络规划 华为eNSP 网络规划 ShenTong nvidia EMUI 回退 降级 gnu 线程 seleium chromedriver 自动化测试 swoole 三级等保 服务器审计日志备份 FTP服务器 kali 共享文件夹 SSH 服务 SSH Server OpenSSH Server Invalid Host allowedHosts QT 5.12.12 QT开发环境 Ubuntu18.04 智能音箱 智能家居 服务器数据恢复 数据恢复 存储数据恢复 北亚数据恢复 oracle数据恢复 docker搭建nacos详解 docker部署nacos docker安装nacos 腾讯云搭建nacos centos7搭建nacos ESXi 干货分享 渗透测试 黑客工具 密码爆破 西门子PLC 通讯 ip命令 新增网卡 新增IP 启动网卡 P2P HDLC 项目部署 宕机切换 服务器宕机 list 模拟实现 dba 单元测试 功能测试 PX4 ROS c 执法记录仪 智能安全帽 smarteye springcloud triton 模型分析 RAID RAID技术 磁盘 存储 矩阵 线性代数 电商平台 灵办AI 服务器时间 流量运营 链表 uv 图形化界面 换源 Debian DOIT 四博智联 YOLOv12 stm32项目 软件需求 cocoapods xcode yolov8 threejs 3D edge浏览器 wsgiref Web 服务器网关接口 软负载 skynet transformer 多进程 元服务 应用上架 常用命令 文本命令 目录命令 阿里云ECS AI Agent 字节智能运维 宝塔面板 ardunio BLE rnn trae H3C 命名管道 客户端与服务端通信 crosstool-ng PVE npm 办公自动化 自动化生成 pdf教程 CentOS iventoy VmWare OpenEuler gcc g++ g++13 wireshark deekseek 知识库 产品经理 MDK 嵌入式开发工具 论文笔记 sublime text 测试用例 磁盘监控 arcgis Cookie 服务器配置 Ubuntu DeepSeek DeepSeek Ubuntu DeepSeek 本地部署 DeepSeek 知识库 DeepSeek 私有化知识库 本地部署 DeepSeek DeepSeek 私有化部署 多层架构 解耦 Unity插件 影刀 #影刀RPA# dell服务器 trea idea uni-file-picker 拍摄从相册选择 uni.uploadFile H5上传图片 微信小程序上传图片 arm Google pay Apple pay pyautogui 分析解读 ue4 着色器 ue5 X11 Xming 运维监控 微信分享 Image wxopensdk 生物信息学 Linux find grep cuda cudnn anaconda 信号 mamba Vmamba 代理 onlyoffice figma DNS Spring Security prompt UDP bot Docker 风扇控制软件 leetcode 推荐算法 游戏开发 cnn GoogLeNet 视觉检测 MacMini 迷你主机 mini Apple 系统开发 binder 车载系统 framework 源码环境 IPMI 带外管理 宠物 毕业设计 免费学习 宠物领养 宠物平台 硬件 设备 GPU PCI-Express VMware创建虚拟机 cd 目录切换 阻塞队列 生产者消费者模型 服务器崩坏原因 jetty undertow tidb GLIBC grub 版本升级 扩容 lio-sam SLAM 双系统 代理服务器 Node-Red 编程工具 流编程 磁盘镜像 服务器镜像 服务器实时复制 实时文件备份 Erlang OTP gen_server 热代码交换 事务语义 信创 信创终端 中科方德 MNN Qwen 大模型推理 大模型学习 嵌入式系统开发 搭建个人相关服务器 x64 SIGSEGV SSE xmm0 sqlite3 音乐服务器 Navidrome 音流 Windsurf ping++ SWAT 配置文件 服务管理 网络共享 wordpress 无法访问wordpess后台 打开网站页面错乱 linux宝塔面板 wordpress更换服务器 firewalld dns是什么 如何设置电脑dns dns应该如何设置 xpath定位元素 DeepSeek行业应用 Heroku 网站部署 在线预览 xlsx xls文件 在浏览器直接打开解析xls表格 前端实现vue3打开excel 文件地址url或接口文档流二进 程序员创富 docker run 数据卷挂载 交互模式 VR手套 数据手套 动捕手套 动捕数据手套 word图片自动上传 word一键转存 复制word图片 复制word图文 复制word公式 粘贴word图文 粘贴word公式 bat 端口 查看 ss Open WebUI conda配置 conda镜像源 强化学习 RAGFlow 本地知识库部署 DeepSeek R1 模型 gradle 7z RoboVLM 通用机器人策略 VLA设计哲学 vlm fot robot 视觉语言动作模型 具身智能 输入法 docker部署翻译组件 docker部署deepl docker搭建deepl java对接deepl 翻译组件使用 技能大赛 C# MQTTS 双向认证 emqx av1 电视盒子 机顶盒ROM 魔百盒刷机 分布式训练 linux 命令 sed 命令 聊天室 远程服务 langchain deep learning 程序 热榜 ocr 自动化任务管理 自动驾驶 数据可视化 算力 环境配置 DBeaver Radius rpa Typore keepalived camera Arduino 电子信息 VLAN 企业网络 sonoma 自动更新 大模型部署 xshell termius iterm2 相机 linux环境变量 neo4j 数据仓库 数据库开发 数据库架构 database chrome devtools yum源切换 更换国内yum源 iBMC UltraISO 物联网开发 minicom 串口调试工具 lua clickhouse vue-i18n 国际化多语言 vue2中英文切换详细教程 如何动态加载i18n语言包 把语言json放到服务器调用 前端调用api获取语言配置文件 社交电子 ArcTS 登录 ArcUI GridItem 高效远程协作 TrustViewer体验 跨设备操作便利 智能远程控制 arkUI 服务网格 istio js HAProxy 数据管理 数据治理 数据编织 数据虚拟化 EtherCAT转Modbus ECT转Modbus协议 EtherCAT转485网关 ECT转Modbus串口网关 EtherCAT转485协议 ECT转Modbus网关 充电桩 欧标 OCPP 音乐库 飞牛 实用教程 chfs ubuntu 16.04 同步 备份 建站 合成模型 扩散模型 图像生成 Xinference vr 金仓数据库 2025 征文 数据库平替用金仓 直流充电桩 域名服务 DHCP 符号链接 配置 nac 802.1 portal 语法 DocFlow 裸金属服务器 弹性裸金属服务器 p2p 边缘计算 TRAE 鸿蒙开发 移动开发 Nuxt.js docker命令大全 Linux环境 dns 大模型入门 捆绑 链接 谷歌浏览器 youtube google gmail 李心怡 HTTP 服务器控制 ESP32 DeepSeek 怎么卸载MySQL MySQL怎么卸载干净 MySQL卸载重新安装教程 MySQL5.7卸载 Linux卸载MySQL8.0 如何卸载MySQL教程 MySQL卸载与安装 状态管理的 UDP 服务器 Arduino RTOS 图形渲染 AD域 致远OA OA服务器 服务器磁盘扩容 Linux的权限 黑苹果 VMware okhttp CORS 跨域 游戏机 sequoiaDB 技术共享 ceph 智能硬件 AP配网 AK配网 小程序AP配网和AK配网教程 WIFI设备配网小程序UDP开 alias unalias 别名 mm-wiki搭建 linux搭建mm-wiki mm-wiki搭建与使用 mm-wiki使用 mm-wiki详解 编程 mariadb prometheus数据采集 prometheus数据模型 prometheus特点 Python基础 Python教程 Python技巧 yaml Ultralytics 可视化 大模型微调 docker部署Python code-server 深度求索 私域 文件系统 路径解析 Ark-TS语言 SysBench 基准测试 软链接 硬链接 hosts 源码 wpf WebUI DeepSeek V3 Claude mybatis rocketmq MS Materials 大模型面经 AnythingLLM AnythingLLM安装 混合开发 环境安装 JDK gateway Clion Nova ResharperC++引擎 Centos7 远程开发 regedit 开机启动 模拟退火算法 EtherNet/IP串口网关 EIP转RS485 EIP转Modbus EtherNet/IP网关协议 EIP转RS485网关 EIP串口服务器 基础环境 在线office CrewAI 京东云 银河麒麟高级服务器 外接硬盘 Kylin flink ubuntu20.04 开机黑屏 信息可视化 网页设计 jina 基础入门 匿名管道 华为机试 流水线 脚本式流水线 数据库系统 efficientVIT YOLOv8替换主干网络 TOLOv8 webgl cmos 本地化部署 AISphereButler 腾讯云大模型知识引擎 DenseNet centos-root /dev/mapper yum clean all df -h / du -sh 考研 沙盒 玩机技巧 软件分享 软件图标 word win服务器架设 windows server 多路转接 epoll 迁移指南 框架搭建 VMware安装mocOS macOS系统安装 私有化 llama.cpp 增强现实 沉浸式体验 应用场景 技术实现 案例分析 AR 做raid 装系统 ros remote-ssh Dell HPE 联想 浪潮 内网服务器 内网代理 内网通信 VM搭建win2012 win2012应急响应靶机搭建 攻击者获取服务器权限 上传wakaung病毒 应急响应并溯源 挖矿病毒处置 应急响应综合性靶场 开发 MySql 虚幻引擎 RustDesk自建服务器 rustdesk服务器 docker rustdesk USB网络共享 gpt CH340 串口驱动 CH341 uart 485 Playwright ubuntu24 vivado24 火绒安全 VPS .net mvc断点续传 ssh远程登录 剧本 k8s集群资源管理 云原生开发 WebRTC uniapp Ubuntu Server Ubuntu 22.04.5 RAGFLOW vscode1.86 1.86版本 ssh远程连接 浏览器开发 AI浏览器 ssh漏洞 ssh9.9p2 CVE-2025-23419 软件定义数据中心 sddc 自动化编程 RTMP 应用层 移动魔百盒 状态模式 USB转串口 飞牛NAS 飞牛OS MacBook Pro harmonyOS面试题 opensearch helm 服务器管理 配置教程 服务器安装 网站管理 雨云 NPS vmware 卡死 邮件APP 免费软件 lsb_release /etc/issue /proc/version uname -r 查看ubuntu版本 IO模型 AI代码编辑器 Linux PID ros2 moveit 机器人运动 Ubuntu 24 常用命令 Ubuntu 24 Ubuntu vi 异常处理 VS Code ubuntu24.04.1 opcua opcda KEPServer安装 LInux ai小智 语音助手 ai小智配网 ai小智教程 esp32语音助手 diy语音助手 AD 域管理 spark HistoryServer Spark YARN jobhistory 网站搭建 serv00 NFS 工作流 workflow 微信开放平台 微信公众号配置 VSCode hexo token sas 小智AI服务端 xiaozhi TTS FTP 服务器 网络药理学 生信 PPI String Cytoscape CytoHubba CentOS Stream rime iphone zookeeper 服务器部署ai模型 iftop 网络流量监控 Anolis nginx安装 linux插件下载 Docker引擎已经停止 Docker无法使用 WSL进度一直是0 镜像加速地址 perf make命令 makefile文件 粘包问题 raid5数据恢复 磁盘阵列数据恢复 自定义客户端 SAS kerberos searxng 僵尸世界大战 游戏服务器搭建 上传视频至服务器代码 vue3批量上传多个视频并预览 如何实现将本地视频上传到网页 element plu视频上传 ant design vue vue3本地上传视频及预览移除 TCP协议 minecraft GIS 遥感 WebGIS composer firewall 拓扑图 产测工具框架 IMX6ULL 管理框架 大大通 第三代半导体 碳化硅 蓝桥杯 ai工具 java-rocketmq v10 软件 ldap openstack Xen 微信小程序域名配置 微信小程序服务器域名 微信小程序合法域名 小程序配置业务域名 微信小程序需要域名吗 微信小程序添加域名 Kylin-Server 半虚拟化 硬件虚拟化 Hypervisor 内网环境 Kali Linux 信息收集 h.264 milvus micropython esp32 mqtt nlp 流式接口 URL 项目部署到linux服务器 项目部署过程 架构与原理 Logstash 日志采集 pyqt 性能分析 pgpool 端口测试 田俊楠 网卡的名称修改 eth0 ens33 大文件分片上传断点续传及进度条 如何批量上传超大文件并显示进度 axios大文件切片上传详细教 node服务器合并切片 vue3大文件上传报错提示错误 大文件秒传跨域报错cors cpp-httplib 网工 Attention Redis Desktop 压测 ECS xrdp SRS 流媒体 直播 Unity Dedicated Server Host Client 无头主机 ABAP Deepseek-R1 私有化部署 推理模型 dock 加速 RAG 检索增强生成 文档解析 大模型垂直应用 政务 分布式系统 监控运维 Prometheus Grafana proxy模式 outlook 虚拟局域网 fast gpt-3 文心一言 崖山数据库 YashanDB matplotlib 大模型应用 视频编解码 源码剖析 rtsp实现步骤 流媒体开发 bcompare Beyond Compare OpenSSH 存储维护 NetApp存储 EMC存储 dash 正则表达式 TrueLicense 性能测试 雨云服务器