thumbnail image
broken image
broken image

人工智能服务商城

  • 首页
  • 代充中心
  • 接口中心 
    • 原生接口商城
    • 中转接口商城
  • 数据中心
  • 查看更多 
    • 开发中心
    • 算力中心
    • 代理中心
    • Blog
    • 交流社群
    • 维多利计划
    • 关于我们
  • 购物指南 
    • AI系列教程
    • API系列教程
    • 其他服务教程
    • 2025新产品指南
  • …  
    • 首页
    • 代充中心
    • 接口中心 
      • 原生接口商城
      • 中转接口商城
    • 数据中心
    • 查看更多 
      • 开发中心
      • 算力中心
      • 代理中心
      • Blog
      • 交流社群
      • 维多利计划
      • 关于我们
    • 购物指南 
      • AI系列教程
      • API系列教程
      • 其他服务教程
      • 2025新产品指南
客户支持
broken image
broken image

人工智能服务商城

  • 首页
  • 代充中心
  • 接口中心 
    • 原生接口商城
    • 中转接口商城
  • 数据中心
  • 查看更多 
    • 开发中心
    • 算力中心
    • 代理中心
    • Blog
    • 交流社群
    • 维多利计划
    • 关于我们
  • 购物指南 
    • AI系列教程
    • API系列教程
    • 其他服务教程
    • 2025新产品指南
  • …  
    • 首页
    • 代充中心
    • 接口中心 
      • 原生接口商城
      • 中转接口商城
    • 数据中心
    • 查看更多 
      • 开发中心
      • 算力中心
      • 代理中心
      • Blog
      • 交流社群
      • 维多利计划
      • 关于我们
    • 购物指南 
      • AI系列教程
      • API系列教程
      • 其他服务教程
      • 2025新产品指南
客户支持
broken image
返回
LLM大模型训练数据(香港社会综合类900G)

LLM大模型训练数据(香港社会综合类900G)

HK$39,999.00
产品名称:
香港社会综合数据包(1850–2024)

概述:
该数据集是精心整理的集合,涵盖了香港社会的多个领域,包括本地新闻、行业人物、法律制度、学术、人文学科以及金融数据,包括文本,图片,音频,视频等数据。时间跨度长达两个世纪(1850–2024)。它为大型语言模型(LLM)及AI算法的训练提供了丰富的资源,适用于文本生成、情感分析和知识检索等任务。

数据格式:
文本文件: 结构化和非结构化文本,格式包括 .txt、.csv 和 .json,便于集成到LLM训练框架中。
元数据: 包含元数据如发布日期、作者信息和来源详细信息,格式为 .csv 和 .json。
注释: 预先注释的数据集,用于自然语言处理任务,包括实体识别和主题分类(.json 或 .xml 格式)。
含少量图像、视频、音频文件。

交付流程:
完成购买后,系统自动将数据包下载链接发送你的邮箱中,在下载链接中直接下载提取即可。
如购买多个数据包/金额较大(超过10万港币),可分批下单支付,或者联系客服获取大额付款方式(例如企业支付宝、企业转账、虚拟货币等)。

发布日期:2024年9月19号
数量
即将发布
加入购物车
更多详情

产品名称:
香港社会综合数据集(1850–2024)

概述:
该数据集是精心整理的集合,涵盖了香港社会的多个领域,包括本地新闻、行业人物、法律制度、学术、人文学科以及金融数据,包括文本,图片,音频,视频等数据。时间跨度长达两个世纪(1850–2024)。它为大型语言模型(LLM)及AI算法的训练提供了丰富的资源,适用于文本生成、情感分析和知识检索等任务。

数据格式:

  • 文本文件: 结构化和非结构化文本,格式包括 .txt、.csv 和 .json,便于集成到LLM训练框架中。
  • 元数据: 包含元数据如发布日期、作者信息和来源详细信息,格式为 .csv 和 .json。
  • 注释: 预先注释的数据集,用于自然语言处理任务,包括实体识别和主题分类(.json 或 .xml 格式)。

数据采集和来源:
该数据集从权威来源收集,包括:

  • 新闻档案: 本地报纸和媒体,涵盖了从1850年到2024年的政治、社会和经济事件。
  • 行业人物: 香港各行业的关键人物传记数据,包括商业、金融和政治领域。
  • 法律文件: 最新的香港法律、法规和政府公告,提供法律和社会背景信息。
  • 学术收藏: 来自香港大学和智库的学术文章和研究报告。
  • 人文与文化数据: 反映香港文化发展的人文文本、艺术评论和社会趋势。
  • 金融数据: 来自香港金融中心的历史和实时数据,包括股票市场指数和经济报告。

数据预处理和训练方法:

  • 预处理: 数据经过严格的清理、规范化和标记化处理,确保过滤敏感信息并遵守隐私法规。
  • 训练方法: 针对transformer、GPT等最新LLM架构进行优化,数据集包含特定用例的微调说明,如聊天机器人开发、摘要生成或情感分析。
  • 增强技术: 为提高数据的鲁棒性,数据集还包括扩充技术,如释义、同义词替换和句子重排。

最新情况:

  • 2024年更新: 数据集包含2024年的最新数据,确保通过该数据集训练的模型能够反映香港最新的法律、经济和社会环境。
  • 持续更新支持: 提供定期更新,确保数据集与香港不断发展的社会格局保持同步,购买者可以通过订阅或直接下载获得更新。

交付流程:

  1. 购买: 用户可在平台上选择该数据集。
  2. 支付: 通过安全支付流程完成交易。
  3. 交付: 支付确认后,用户将收到下载链接或数据传输说明,交付方式将根据用户存储设备进行定制。

发布日期:
2024年9月19日

更新包:

  • 版本控制: 数据集采用版本控制发布,并提供新数据的更新包。
  • 更新频率: 更新包将每半年发布一次,或根据高级订阅用户的请求进行更新。
  • Neuronicx

    一站式AI服务商城

    想订阅ChatGPT Plus?

    想采购原生接口 o3 API?

    想采购GPT-4o Image API?

    想采购LLM大模型训练数据?

    找我们,就对了!

    支持企业定制合作!

    我们专业提供一站式

    AI、API、LLM数据等服务!

    立即购买
  • 热门产品

    5月23日,Claude-4模型正式推出!

  • 24小时·一站式AI代充服务

    我们提供一站式ChatGPT、Claude代充服务。

  • 24小时·一站式API采购服务

    我们提供一站式GPT API、Claude API采购服务,支持24小时自助下单。

  • 24小时·一站式LLM数据服务

    我们提供一站式AI数据采购服务,并支持定制各种LLM训练数据。

我们的服务
一站式AI代充服务
一站式AI API服务
一站式LLM训练数据服务
一站式AI开发者服务
一站式代理批发服务
优惠活动
GPT API购买指南
资讯博客
使用说明
服务条款
隐私政策
Telegram 客服:
Neuronicx
E-Mail 客服:
office@neuronicx.com
Neuronicx,Copyright 2023-2025.
    联系客服
Cookie的使用
我们使用cookies来确保流畅的浏览体验。若继续,我们认为你接受使用cookies。
了解更多