学生联盟网为您提供优质参考范文! 体会工作报告法律咨询精彩演讲各类材料
当前位置: 学生联盟网 > 人文社科 > 哲学 > 几个值得关注的语义出版研究热点

几个值得关注的语义出版研究热点

时间:2021-05-08 10:26:41 来源:学生联盟网

  [摘 要] 自语义出版的概念正式提出后,工业界和学界对语义出版的关注越来越高,由于语义出版和Web技术密切相关,近几年Web等领域的发展给语义出版带来了新动向,也出现了一些对语义出版内涵的再思考。本文对目前主流的语义出版研究和实践现状进行梳理总结,发掘了语义出版数据的开放共享、去中心化语义出版实践、真正的语义出版等研究热点,希望引起学界对这些研究方向的关注和重视。语义出版数据的开放共享、去中心化实践是Web技术的开放性及数据科学发展的必然结果,伴随着这些最新的技术和实践原则的提出和推进,将进一步引起各界对语义出版研究与实践的深化以及对什么是真正的语义出版的思考。
  [关键词] 语义出版 开放共享 FAIR 可信任 去中心化
  [中图分类号] G237 [文献标识码] A [文章编号] 1009-5853 (2018) 02-0016-07
  [Abstract] After the definition of semantic publishing put forward in 2009, more and more attentions are paid from industry and academia. Due to the close relation between semantic publishing and web techniques, new trends from the field of web and related domains were brought into the scope of semantic publishing, and some new ideas about the original concept of semantic publishing emerged recently. In this paper, main stream of semantic publishing studies and practices were classified and summarized, and opening, sharing, decentralizing and genuine semantic publishing as the newest hotspots in semantic publishing field were proposed with expectation to bring more attentions to people in this field. It is an inevitable result of the openness of the Web and development of data science that opening, decentralizing as new trends come out in the development of semantic publishing. Together with these newly put forward techniques and principles, this will introduce more and more people to consider the connotation of the genuine semantic publishing in the future and promote more and more study and research in deep.
  [Key words] Semantic publishing Opening and sharing FAIR Trusty publishing Decentralization
  1 引 言
  自肖頓(Shotton)[1][2]首次提出语义出版(semantic publishing)的概念后,语义出版在学术界和工业界的研究和实践逐渐升温。语义出版其实可以简单地总结为任何可以增强出版物语义内涵的技术手段,它是Web技术尤其是语义Web技术、文本分析等技术和出版领域实践的一次有意义的融合。Web技术中的信息发布、访问协议以及标记语言等技术为语义出版物提供了开放的访问存取环境,语义Web技术中的RDF/OWL标准、Linked Data技术及实践原则为语义出版物提供了规范的表示模型,以自然语言处理为核心的文本分析与挖掘技术则为语义出版流程的自动化提供了支撑。因此,语义出版概念并不是作为一项新的技术被提出,它是各种现有技术在出版领域中广泛应用后自然而然被归纳总结的结果。具体而言,语义出版通过可视化、动态检索等手段来增强出版物的语义,对相似内容的出版物进行关联,共享出版物背后的科学数据,增加丰富的出版物元数据来提高机器的可读性,进而促进出版物的可发现性。
  语义出版模式的流行对现有的基于科学论文层次的科学交流来讲意义重大。传统的科学出版模式将科学研究成果使用自然语言进行表达并集中存储在数据库中,实际上科学论文以这种方式呈现其中蕴含的知识被发现的概率并不高,科研人员需要进行繁琐的出版物检索、研读等科研活动才能获取并总结出所需的科研背景和现状。而语义出版要求出版物具有丰富的元数据、细粒度的以及高度互联的内容片段,这可以极大地提高学术交流的效率以及新知识的发现概率[3],避免或者降低科学假设以及科学实验的重复进行。本文简要梳理了目前最新的主流语义出版的研究与实践,重点分析在开放科学的环境下,语义出版研究与实践的几个最新的研究热点,主要包括:语义出版数据开放共享、语义出版的去中心化实践以及对什么是真正的语义出版的思考。
  2 语义出版发展现状
  语义出版技术在出版业中的应用越来越广泛[4],国际诸多大型企业如威科集团[5]、爱思唯尔出版集团[6]、BBC[7][8]等早已将语义出版技术作为其创新战略和商业实践的一部分。国内外对语义出版的科学研究与实践也逐渐增多,已经有语义出版相关的图书及专著相继问世,诸如文献[9][10][11]等。语义出版相关的科学活动也相当活跃,知名的要数最近几年陆续组织的语义出版国际研讨会(Semantic Publishing Workshop,SePublica)[12],致力于解决语义出版相关的各种原则、技术问题,以及每年举办的语义出版挑战赛(Semantic Publishing Challenges)[13],主要以从科学文献中自动抽取知识片段为任务目标。