news 2026/6/15 13:59:33

基于豆包、Claude识别的中国 A 股人工智能领域企业数据 2010-2024

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于豆包、Claude识别的中国 A 股人工智能领域企业数据 2010-2024

2030

基于豆包、Claude识别的中国 A 股人工智能领域企业数据 2010-2024

数据简介

在智能技术快速发展的浪潮中,通过企业的经营范围文本精准识别中国 A 股市场中属于人工智能领域的企业,是深入探究该领域发展规律、评估产业发展潜力的关键前提。其重要性不仅体现在为学术研究提供可靠的样本基础,也为企业战略制定、市场监管等实践工作提供有力的数据支撑。

人工智能企业是以人工智能技术为核心驱动力,致力于研发和应用机器学习、深度学习、自然语言处理等智能算法,实现模拟人类智能进行决策、推理、识别等功能,像从事人工智能算法研发、智能系统集成、智能机器人研发等业务的企业便属于此类,其核心在于让机器具备类似人类的智能能力。

本数据中用于依据企业经营范围文本判断其是否为人工智能企业的核心指标构建过程如下:数据来源于中国 A 股上市公司的官方网站、年度报告等公开渠道。借助豆包(doubao-1-5-pro-32k-250115)和 Claude (claude-sonnet-4-20250514)两个大型模型,分别对企业的经营范围文本内容进行识别,综合两者的判断结果,确定该企业是否为人工智能领域的企业,最终获得 2010-2024 年的相关数据。

与使用 XGBOOST、BERT 等机器学习模型基于经营范围文本进行判断的方式相比,本方法优势显著。XGBOOST 作为基于树模型的算法,高度依赖人工特征工程,对于企业经营范围这类复杂文本,人工提取特征不仅耗时费力,还易遗漏关键信息,导致其对复杂语义的理解能力受限,难以精准识别人工智能领域的企业。BERT 虽在自然语言处理领域表现较好,但在泛化性和对非规范文本的处理上存在不足,面对企业经营范围中涉及人工智能领域的模糊表达、行业特有术语等,准确性会受影响。而豆包和 Claude 具备强大的自然语言理解与生成能力,无需复杂的特征构建,能深度解读企业经营范围文本中的语义信息,对涉及人工智能领域的模糊、非规范表述有效理解,从而更精准判断企业是否为人工智能领域企业。

选择豆包和 Claude 进行判断,原因在于豆包是一款先进的语言模型,在中文语义理解方面优势突出,能精准把握中国上市公司各类文本中复杂的经营范围表述,尤其对涉及人工智能领域的内容有良好的解读能力,契合国内市场的语言习惯和业务场景。Claude 是一款知名的大型模型,在多领域应用广泛,对不同业务场景的经营范围理解能力较强,且在多语言处理上有一定优势,能辅助识别人工智能领域企业。二者结合,可从不同角度对企业经营范围文本深入分析,形成互补,降低误判概率,提升判断结果的准确性和全面性。

数据来源

中国 A 股上市公司官方网站、上市公司年度报告等。

时间跨度

2010-2024 年

数据范围

中国 A 股上市公司

数据格式

excel形式

数据指标

注: Symbol为 股票代码,IndustryCode为行业分类,is_ai为两大模型根据企业经营范围识别的是否为人工智能企业的0-1变量,1表示是人工智能企业,0表示不是。

数据展示

因数据量较大,此处仅展示部分示例数据:

选题方向

1.基于双模型对人工智能企业经营范围文本识别的效果优化研究:以本数据为基础,对比豆包和 Claude 单独基于经营范围文本识别与联合识别人工智能企业的效果差异,构建优化的双模型识别机制,为提高人工智能企业分类准确性提供新方法。

2.从经营范围文本看人工智能企业动态发展轨迹:利用 2010-2024 年的数据,通过分析企业经营范围文本的变化,追踪人工智能企业在不同时期的发展变化,分析其成长规律与制约因素。

3.人工智能企业与经营绩效的关联性分析:选取数据中的企业,探究人工智能企业与非人工智能企业在营收增长、利润率等经营绩效指标上的差异,揭示人工智能属性对企业发展的影响。

4.政策环境对人工智能企业数量变化的影响研究:梳理 2010-2024 年相关政策,结合数据中人工智能企业的数量变化情况,运用回归模型分析政策对该类企业发展的驱动作用。

5.跨行业视角下人工智能企业技术应用扩散:以识别出的人工智能企业为样本,分析其技术向其他行业企业的扩散路径与效果,为推动产业融合提供参考。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 11:20:46

计算机毕业设计hadoop+spark+hive交通拥堵预测 交通流量预测 智慧城市交通大数据 交通客流量分析(源码+LW文档+PPT+讲解视频)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 技术范围:Sprin…

作者头像 李华
网站建设 2026/6/15 13:39:43

【C#数据处理高性能实践】:如何在3分钟内完成百万级数据清洗

第一章:C#百万级数据清洗的挑战与优化路径在处理百万级数据清洗任务时,C#开发者常面临内存溢出、处理速度缓慢和资源竞争等问题。传统的List加载全部数据到内存的方式已不适用,必须采用流式处理与分批策略以降低内存占用。内存管理与数据流控…

作者头像 李华
网站建设 2026/6/15 10:44:35

HeyGem数字人系统支持哪些音频和视频格式?一文说清

HeyGem数字人系统支持哪些音频和视频格式?一文说清 在企业数字化转型加速的今天,AI生成内容(AIGC)正从“炫技”走向“实用”。尤其是在营销宣传、在线教育和智能客服等场景中,数字人播报已成为提升内容生产效率的关键手…

作者头像 李华
网站建设 2026/6/15 10:42:27

新能源知识库(167)什么是章鱼能源?

章鱼能源(Octopus Energy,简称 OE)是目前全球能源行业中最具颠覆性的公司之一。它于2015年在英国成立,凭借强大的科技基因(尤其是大数据和AI技术),仅用了八年时间就超越了老牌巨头英国天然气&am…

作者头像 李华
网站建设 2026/6/15 10:42:19

企业级权限架构落地实践(从RBAC到ABAC的演进之路)

第一章:企业级权限架构的演进背景随着企业数字化转型的加速,系统复杂度与用户规模持续增长,传统的权限管理方式已难以满足现代应用对安全性、灵活性和可维护性的要求。早期的权限模型多采用硬编码或简单的角色控制,导致权限逻辑分…

作者头像 李华
网站建设 2026/6/15 10:40:58

STM32F407 OLED显示屏驱动开发实战指南

STM32F407 OLED显示屏驱动开发实战指南 一、OLED显示技术基础 OLED工作原理 OLED(有机发光二极管)是一种自发光显示技术,每个像素点由有机材料组成,通电后直接发光。与LCD相比具有以下优势: 自发光:无需…

作者头像 李华