账号: 密码:
中国大学出版社协会 | 首页 | 宏观指导 | 出版社天地 | 图书代办站 | 教材图书信息 | 教材图书评论 | 在线订购 | 教材征订
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
大数据推动学术出版革新 - 出版论坛 - 中国高校教材图书网
主页 > 出版论坛
大数据推动学术出版革新
作者:孙牧
2013-10-10 14:47:01  来源:《中国出版传媒商报》2013/10/8 
 

  本文开始前首先介绍两个关键 词:BigData和MOOCs,BigData是指大数据,谈的不仅仅是数据量,其实包含了数据量(Volume)、时效性(Velocity)、多变 性(Variety)、可疑性(Veracity)四个要素;MOOCs是“大规模网络公开课”(MassiveOpenOnlineCourses)的 缩写,通译为“慕课”。这些免费网络课程面向全世界所有人,意味着只要你有一台笔记本和网络联接,就可随时随地接受高等教育。

  今年5月,国际科技医药出版商协会在华盛顿召开了2013年创新研讨会,研讨会的主题是:大数据、慕课,以及作者/研究人员工具。围绕着这三个主题,来自学术出版业内外的嘉宾探讨了数字环境下学术出版快速转型过程中遇到的问题。

  大数据和第四范式

   研讨会主旨发言人、微软研究院“云研究”战略部主任丹尼斯·甘农强调,一场新的数据变革正在悄然进行。“现在科学研究正从过去的第一范式实验归纳、第二 范式模型推演、第三范式仿真模拟,过渡演化到第四范式密集数据分析时代。第四范式通过密集的数据分析和挖掘,可能获得新的科学发现。”但是,丹尼斯也提醒 道,这些数据必须是可延展的、持续稳定的、关联的,而且运算分析方法要有依据。在数据搜索中必然要用到语义学,而概念群在数据分析使用过程中也非常重要。 丹尼斯作出了如下预言:仅凭一部机器就可以为一篇科学论文写出概要,并且比作者本人写的概要质量还要好。丹尼斯以微软研究院埃里克·霍维茨主任研发的一个 预测模型为例,说明了大数据在医疗行业的应用。该预测模型在医院急诊室3万次探访的数据中,抽取了2.5万个数据进行分析加工,从而对能否再次进入医院探 访给出了建议。

  机器的深度学习

   与大数据密切相关的机器的深度学习看起来也是一种新趋势,其目的是建立模拟人脑进行分析学习的机器神经网络。机器学习分有监督学习和无监督学习两种,其 中,无监督学习可能更加有趣。它由于不需要事先根据训练数据去训练聚类器,所以被称为无监督学习。无监督学习主要用于估计数据在任意位置的分布密度,或者 是给出一个样本属于每一类的概率。丹尼斯就此也举了一个例子,就是多伦多大学的杰弗里·亨顿通过无监督学习,对视频网站YouTube上1000万个未贴 标签的视频成功进行了分类。此外,微软即将发布的面向科研人员的产品“微软学术搜索”,以4800万篇论文为样本,分析了科学家之间的关联性,并做出了论 文中引文使用情况的曲线图。

  丹尼斯说,他 期待着大数据能够发挥长尾效应,不仅仅局限在生命医药科学领域,而是在更多的研究领域发挥作用,比如说在经济和历史研究领域。丹尼斯也谈到,科学家们非常 关注大数据或者云资源的应用,期待着该应用不仅能带来程序设计上的更新,而且能大大推动科学研究的进程。

  出版商应关注“慕课”

   美国高等教育在线学习公司SIPX的副总裁海瑟·鲁兰·斯特因斯解释了为什么出版社应该关注“大规模网络公开课”即“慕课”。她给予了“慕课”一个非常 宽泛的解释:“慕课”提供了没有边界的课堂,实际上也不需要提供任何课程结构。“慕课”之所以受欢迎是因为它抓住了人们对于学习的渴求。目前在“慕课”这 一市场竞争领域,有Coursera、edX、Udacity等网站和项目,此外还有Khan学院,该学院注重提供实践性较强的课程学习。此外还有英国大 学的首创Futurelearn、澳大利亚的Open2Study。当然还有一些在线学堂,帮助你创建开发自己的课程。

  目前“慕课”的商业模式仍在探索之中,大多为风险投资在支持,但应该很快有望具有可持续发展性。通过联合投资的方式,“慕课”开始和学分、证书、考试、招聘、资格准入等建立了需求关联。

   “慕课”发展得非常迅猛,代表了一种新的品牌延伸模式,尤其是对于一些声望显赫的大学而言。此外,“慕课”对补偿教育(旨在解决学习过程中遇到的问题, 它能够为信息技术应用于教育拓展新思路,为信息技术与教育结合开辟新途径)、招生过多的专业课程、导入性课程、卫星校园、备考、招生、管理课程和团体训练 等颇有裨益。此外要提及的是,名人“慕课”很受欢迎。

  斯特因斯说,“慕课”需要内容,学术出版商应该抓住这一机会,为“慕课”提供内容,从而开拓新的市场。

  提升数据引文标准

   美国国家科学院数据和信息研究所负责人保罗·乌利尔认为,有必要建立数字环境下数据或信息的引文标准和相关的操作办法。他的建议非常有道理,因为存在于 数字仓库里的,以及非传统出版环境下的数据库和信息,对现有的传统出版的著作文献进行了大量的补充。该研究所即将发布一部白皮书,解决信息引文标准等相关 问题,其中的操作办法将涉及多方利益集团,包括数据中心、大学、研究基金、研究人员、出版商和编辑等。

   乌利尔说这些重要的问题包括:为什么需要重视数据引用,操作的收益会超过投入吗?操作过程是怎样的?谁来操作?对出版有何影响?等等。从事学术出版的埃 菲·施密特指出,有些研究表明,如果算上数据库的引用情况,那么引用率将由传统引用的40%增加到70%。而其中数据转存是非常困难的,因此行业在制定数 据引文规范时要考虑到这一因素。

  科技医学实验室的未来

  革新研讨会的一个保留节目就是分析未来科技医学实验室的走向。美国化学协会的戴维·马汀森指出,目前有三个趋势已经较为明朗:一是由服务机构转向服务个人;二是由封闭的内容转向开放的内容;三是以往唱主角的论文,与补充其后的相关数据一起构成了内容主体。

  马汀森强调,移动终端几乎无所不在,终端客户的体验是出版商最应该关注的。用户有时会通过搜索引擎或非出版商的网址获取内容,在这种情况下,出版商应该通过提供附加内容或工具来丰富终端客户的体验。

  至于开放的内容,马汀森则鼓励出版商寻找新的路径增加收益,比如说基于单篇文章的收费,或者是提供内容给“慕课”等。此外,他建议出版商要做好用户分析,因为在数字时代,用户分析是可操作和实践的,而且能够对出版商如何做好出版提供直接的帮助。

  声音

  出版是一场关乎数据的角逐

  今年10月的法兰克福书展将举办一场讨论数据的论坛,论坛的题目是“大数据和小数据的获取、分析和整合”。近日,聚焦国际出版业报道的在线杂志 PublishingPerspectives对论坛邀请的三位发言人提前进行了访谈,该访谈提前透露了一些关于大数据和小数据的前沿观点。

  位于美国迈阿密的Bookigee公司CEO克莉斯滕·麦克莱恩认为,作为推动传统出版向数字时代转型的战略和技术公司,Bookigee的创立和实践 是创造性的,其重点不在于对传统出版进行经验分析,他们关注的是出版界基因和本质上的演化,这种演化是渐进的,不会在一夜之间一蹴而就,由传统模式突变为 另一种截然不同的模式。

  在应用数据对内容 和目标读者进行决策方面,出版业落在了音乐、电视和电影等许多行业的后面。读者的想法应该驱动出版内容的发展,但是出版商对此特别不情愿,许多主流出版商 甚至都搞不清楚他们实际的读者在哪儿、公司要花多少钱才能获得和维护好这些读者。当然,这也不是出版商的错,许多书业数据都是封闭的,出版商无法获得完整 的大数据,因此也就无法了解和获得更多的读者。出版商拥有的是局限在办公室的小数据,这些小数据可以很好地告诉你,自己的房间发生了什么,但是却不能告诉 你,你的邻居是谁、你所在的城市,发生了哪些故事。你和你的公司也许做得很大,但是你知道新的行业竞争者刚从隔壁买走了1000英亩土地吗?

  位于柏林的出版数据网络公司的CEO塞巴斯蒂安·波斯特认为:传统出版向数字时代转型的过程中,需要全新的处理内容和故事的手段。在数字世界,媒介的文 本和类型,运行方式和传递方式都发生了巨变。但是,数据分析对于出版商而言,是完全陌生的事情,数据分析是一块待开发的处女地。

  数字分析是数字世界商业运行的需要,如果要生存,出版商必须学会这一课。出版商要明白,他们是和零售商、中间商、分销商一起协作工作的,人和人之间、机构和机构之间及时交换数据和想法非常重要。数据不是商业交易行为的附属品,而是进行交易的一个先决条件。

  位于纽约的著名书目数据库公司鲍克公司的产品经理劳拉·道森认为:数字环境下的购买行为完全发生了变化,“购买”等同于“搜索”。亚马逊的书目元数据很 快就会满足不了需要,出版商必须得考虑这些问题:读者怎样才能通过谷歌发现我的书,然后再从谷歌转到亚马逊上进行购买。实际上出版商可以影响所有的购买行 为,包括如何叫卖自己的书,或是标记凸显自己的网址。出版商要明白,读者在网上寻找他们的需要,在网上查验他们听说过的一切,因此,数据的应用和分析,要 像呼吸一样自然融入到出版商的销售行为之中。销售其实是一场关乎数据的角逐,如果不学习而要分析数字世界的“搜索”数据,那么就等同于明明有容易的钱可 赚,但是却不去在意。

  小数据让大数据功能更强大

  业界最近的观点是:大数据和小数据结合在一起使用,能让大数据的功能更加强大。数字战略家马克·邦奇科在《哈佛商业评论》上撰文解释:大数据能够帮助机构 用户了解与他们相关的客户或群体,如顾客、市民、雇员、投票者等。大数据的资料来源非常丰富,这些资料被集中储存在巨大的数据仓库中,经过某种形式的加工 分析后即可应用。对大数据进行分析的结果有助于实现较为精确的预测、更有针对性的交流,以及提供更加个性化的服务。比如说,银行通过分析数十亿次的交易行 为,能够预警可能发生的信用卡诈骗,商家通过分析社交媒体上数百万次的交流互动,理解用户的想法和感受,零售商通过分析顾客数百万次的购买行为,实现更有 针对性的促销。

  而小数据能够帮助个体更加了解自 己,比如说我们买什么、知道什么、要去哪儿、怎样规划时间等。当然了,这是我们的生活,我们当然知道。但是如果将手机、社交媒体、云技术应用到日常生活 中,我们就会比过去更加容易洞察自己的所思所想。以移动健康测量器兴起为例,FitBit或者NikeFuelBand等便携设备,可以记录和测量你的运 动量,并且这些记录能与智能手机实现同步,而关联的APP应用则会对你运动量给予评价回馈、激励甚至是奖励。有研究表明,使用这些追踪测量器的人,似乎更 容易实现减肥或者是塑形目标。

  综合来看, 大数据和小数据的差异主要体现在三个方面:一是关注目标方面。大数据旨在实现机构用户的目标,而小数据旨在帮助个体实现个人目标;二是可见性方面。个体看 不到大数据,小数据也足够个体应用;三是控制力方面。大数据被机构控制,小数据由个体控制。只有经过对方授权,双方才能实现数据信息交换。

  那么,如何实现大数据和小数据的结合,让它们发挥出更大的作用呢?以客户采购行为为例,小数据在个体购物的时候可以起到辅助作用,如根据你过去的购买行 为自动产生出采购清单,提醒你别忘记买牛奶什么的,也可以针对你的兴趣告诉你哪些产品在搞促销,或在你举棋不定的时候告诉你哪些食物可能引起过敏反应。如 果此时我们将大数据和小数据结合到一起看,会发现一些特别有意思的事情。比如说,作为个体消费者,除了了解自己的需求和喜好倾向外,还想知道哪些品牌的顾 客忠诚度高,别人在感恩节的时候都买了些什么,基于对这些类似购买经验的众多小数据的分析,产生出来的大数据的分析结果就会告诉你,你很有可能喜欢购买什 么。

  大数据和小数据可联合应用在众多行业 领域,从旅游、金融服务到健康医疗、政府管理等,当然也包括出版。所以说,当机构或公司聘请大数据专家加入商业智囊团的同时,也别忘记给顾客提供一些关乎 小数据的个体服务——这是一种全新的思考模式,一种激励顾客的新办法。通过提供小数据的个体服务,顾客就能在他们需要的时候,获得适合他们的信息,而不是 漫无边际地在海量信息中寻找自己的需要。

  毫无疑问,大数据改变着行业发展的方方面面,但是在个体交互和个体自由度更强的这样一个时代,只有充分考虑到个体的价值,机构用户才能够实现精准的目标定位。如果想建立个体对机构或产品的忠诚,那么就少花点时间告诉他们你是谁,多花点时间告诉他们是谁,他们需要什么。


来源:《中国出版传媒商报》2013/10/8

本版责编:江蕾
 
 
相关评论 发表评论 发送新闻 打印新闻 上一条 下一条 关闭
| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云章科技