首页>全局检索 - 语言技术与知识技术
-
▪
大规模文本分类的训练语料去噪研究科技报告
( 浏览量:335)
[研究报告]
-
产出机构:中国科学技术信息研究所
产出日期:
2021年01月08日
-
提交机构:中国科学技术信息研究所
发布日期:
2022年07月28日
-
摘要:
随着互联网数据规模的不断增长,大规模文本分类自动标引工具成为当今大数据时代迫切需要的工具之一。自动标引工具的训练目前以监督学习方法为主,而训练语料的质量对于大规模文本分类自动标引工具准确率的提升至关重要。本项目研究旨在通过语义等信息来消除大规模文本分类中的训练语料的噪声,以提升其质量,从而达到提高大规模文本分类自动标引工具准确率的目的,为科研人员更准确地检索文献提供有力支撑。
目前专门针对大规模...
-
▪
智能算法合谋问题及相关技术政策发展研究
( 浏览量:487)
[研究报告]
-
产出机构:中国科学技术信息研究所
产出日期:
2021年12月10日
-
提交机构:中国科学技术信息研究所
发布日期:
2022年07月01日
-
摘要:
作为人工智能技术的基础和核心,人工智能算法对推动人工智能产业和技术的发展有着至关重要的作用。人工智能算法技术日渐成为一种重要的资源和手段,是当今世界催生产品创新、孕育市场竞争新方式和推动生产力跃升的强大引擎。蓬勃发展的人工智能算法技术在越来越多的产业中得到应用,对产业发展态势和市场竞争带来的影响和冲击与日俱增。当前,人工智能算法技术对各大产业发展引起的变化越来越显著,这迫切需要引起学界的高度关注和...
-
▪
中国分类主题词表SKOS模型转换研究
( 浏览量:444)
[研究报告]
-
产出机构:中国科学技术信息研究所
产出日期:
2021年06月23日
-
提交机构:中国科学技术信息研究所
发布日期:
2022年06月17日
-
摘要:
《中国分类主题词表》是我国知识组织领域目前规模最大、内容组织最全面和丰富的分类主题一体化词表,该表融合了《中国图书馆分类法》和《汉语主题词表》的优势,可满足用户从领域分类组织和主题聚焦检索的双重需求。传统分类主题词表主要为图书情报人员的信息标引工作而构建的,如何将传统的词表结构转换为人机都可用的知识结构,使其在当前多源、异构、海量环境下发挥作用是图书情报工作新的方向和热点,本研究便是以W3C推荐的...
-
▪
基于地平线扫描的颠覆性技术识别研究——以工业机器人领域为例
( 浏览量:480)
[研究报告]
-
产出机构:中国科学技术信息研究所
产出日期:
2021年12月21日
-
提交机构:中国科学技术信息研究所
发布日期:
2022年06月13日
-
摘要:
在地平线扫描相关理论的基础上,对技术识别方法进行系统梳理和研究。在各类技术中,识别和监测潜在的颠覆性技术对于企业和国家在发展过程及未来规划中及时调整技术创新战略、规避风险具有重大战略意义。以颠覆性技术为研究重点,通过阐述颠覆性技术的概念及特征,对比分析颠覆性技术的识别方法,在技术特征和市场特征两方面维度下以技术可行性、技术突破性、技术集成性、技术前沿性、技术影响力五个指标构建颠覆性技术评价指标体系...
-
▪
数字文献资源区域服务模式研究
( 浏览量:1934)
[研究报告]
-
产出机构:山东省科学技术情报研究院
产出日期:
2021年07月08日
-
提交机构:山东省科学技术情报研究院
发布日期:
2021年12月10日
-
摘要:
数字文献资源区域性服务是政府公益性公众服务的重要内容,其建设应贯彻整体性构建原则,使构成系统的各个要素相互关联、相互作用,发挥系统的整体性功能。本研究阐述了数字文献资源系统的常见服务模式,并论述科技创新与数字文献资源的关系,提出数字文献资源区域性服务的可持续发展策略,对区域数字文献资源服务模式进行了优化。...
-
▪
数字媒体服务平台建设研究
( 浏览量:916)
[研究报告]
-
产出机构:吉林省科学技术信息研究所
产出日期:
2021年05月25日
-
提交机构:吉林省科学技术信息研究所
发布日期:
2021年11月03日
-
摘要:
数字媒体是以现代互联网作为主要传播载体,并且利用数字媒体编辑系统对所采集信息进行加工处理,呈现出的是一种数字化的商业产品,可以认为是一种现代化、无纸化的快速传播方式,并以大众传播为理论依据,在文艺、教育、商业等领域广泛应用。新世纪开始的第二个十年里,东北地区经济发展势头减缓,传统工业企业发展缓慢,区域经济急需转型升级,在国家十三五发展的五年里,在国家对品牌战略大力推广的背景下,吉林省委、省政府正在...
-
▪
大数据时代国内情报学方法与工具的应用现状研究
( 浏览量:1044)
[研究报告]
-
产出机构:江苏省科学技术情报研究所
产出日期:
2020年06月30日
-
提交机构:江苏省科学技术情报研究所
发布日期:
2021年10月13日
-
摘要:
创新是当今时代发展的重大命题,新一轮科技革命和产业变革的加速演进,使得我国经济社会发展和民生改善比过去任何时候都更加需要科学技术解决方案,也更加需要科技创新这个第一动力。大数据时代,“数据”“信息”“情报”几乎已经渗透到科技创新的各个方面,无论是从事情报分析的专家学者,还是从事科学技术研究的科技人员,面对日益增长和积累的庞大数据集都会期待运用某种手段或方法以发现有价值的情报信息。本课题梳理了我国情...
-
▪
基于ElasticSearch的机器翻译研究
( 浏览量:1044)
[研究报告]
-
产出机构:中国科学技术信息研究所
产出日期:
2020年06月28日
-
提交机构:中国科学技术信息研究所
发布日期:
2021年07月22日
-
摘要:
为了更好地提升“科信智译”的翻译服务水平,我们对科信智译进行了升级改造。翻译引擎采用了谷歌Transformer神经网络机器翻译架构。在数据预处理方面,为了提高训练语料的质量,我们采用通用预处理方式和特定预处理两种方式来处理训练语料和开发集,并探索了多种语料过滤方法。同时,利用Elasticsearch相似语料过滤方法来选择和测试数据相近的开发集。在最终的译文输出过程中,我们采用了模型平均的策略,...
-
▪
中国科学技术信息研究所多语言文献知识库构建
( 浏览量:972)
[研究报告]
-
产出机构:中国科学技术信息研究所
产出日期:
2020年12月10日
-
提交机构:中国科学技术信息研究所
发布日期:
2021年07月20日
-
摘要:
从人工智能概念被提出开始,构建大规模的知识库一直都是人工智能、自然语言处理等领域的核心任务之一。一方面,当前,网络知识用户国际化和多语种化分布两大趋势日渐凸显,这使得建设网络化、多语言的文献知识库成为未来知识挖掘的总体趋势。在全球化和国际化的背景下,研讨、构建和完善多语言文献知识库顺应了知识融通、信息资源共享的时代要求。另一方面,为解决信息技术的快速发展所带来的各民族语言发展的不平衡问题和日益加剧...
-
▪
文本知识发现的理论方法与应用实践
( 浏览量:879)
[研究报告]
-
产出机构:中国科学技术信息研究所
产出日期:
2020年11月18日
-
提交机构:中国科学技术信息研究所
发布日期:
2021年07月13日
-
摘要:
知识发现是从数据集中提取有效的、新颖的、潜在有用的、可理解的模式的非平凡过程。知识发现是一种面向用户的服务,其基本过程有数据准备阶段、数据挖掘阶段、结果评估与解释阶段。知识发现技术可以从各种媒体表示的信息中获得知识,数据来源既包括各种文献、数据库(关系数据库、多媒体数据库、空间数据库、时间数据库)以及 Internet网上的分布式信息。本报告的调研范围限定到基于文献资源(论文、专利、标准等)和网络...