枣庄市重点新闻网站
枣庄论坛| 帐号: 密码: | 注册
您的当前位置:首页>>千城头条 > >正文

面对海量信息,如何实现内容识别

文章来源:人民网 发布时间:2019-08-13 11:37:52 社区讨论
互联网平台的出现以及移动传播体系的形成,改变了人类内容生产和分发的方式。从形态上,互联网平台代替传统媒体成为了信息聚合和分发的枢纽;从传播关系看,社会成员个体的参与愿望及信息需求,形成了当代社会信息交互的双轮驱动。反映在内容生产与分发过程中,现象之一就是互联网用户个人上传的各类内容成为了网络空间里一个海量的存在,以当前发展迅速的短视频平台为例,它们每天都有数以千万条计的短视频内容上传;现象之二是,这样海量的内容只有通过移动终端,面向用户个人的差异化信息需求,通过推送式的精准分发,才能使人们所生产的信息“各得其所”、“各尽其用”,以充分发挥不同内容的效能。

这一切的前提是内容本身是真实的,健康的。而面对每天上传到互联网平台上数以十万篇计的文章、千万条计的短视频、十亿张计的照片这样级别的海量信息,想要鉴别它们的“成色”并实现推送式的精准分发,必须充分运用人工智能技术。这也就是为什么习近平同志在2019年1月25日的中央政治局集体学习时讲话中,要求“探索将人工智能运用在新闻采集、生产、分发、接收、反馈中” 。通俗地说,就是要“互联网技术产生的问题,用互联网技术来解决”。

维护互联网平台上内容的真实性和健康性是一个国际性课题。前不久,在美国参与的“数字时代的美国新旧媒体”考察活动给了我切身体验。中国和美国这两个不同社会制度的国家,都面临着互联网平台带来的各种挑战,其中互联网内容的真实、健康和安全是最为人们关注的。在各自国家政府和社会公众的压力之下,两个国家的互联网平台都在做出努力来解决上述问题。这些努力的主要方面,就是积极利用人工智能技术,开发对互联网内容进行审核的应用。比较分析的结果是,中国的互联网平台在这一领域居于领先地位。

以国内最大的资讯分发平台今日头条及其系列产品为例,其反低俗的软件“灵犬”,经过三次迭代升级,最新版本包括识别类型和模型能力的重要升级,同时应用了“Bert” 和半监督技术 ,并在此基础上使用了专门的中文语料,使对存在色情低俗、暴力谩骂、标题党类问题内容的文本识别准确率提升至91%,还能支持对含有色情低俗、血腥暴力成分的图片的识别。比较而言,谷歌和脸书等平台对虚假、低俗类信息识别的技术路线更多是“重点对用户特征(包括个人级别特征和组织级别特征)、新闻特征(包括文本特征和传播特征)和网络关系(包括用户关系网、事件关系网和传播路径网)这三个要素进行自动查验” ,具体而言,更多依靠用户的反馈和标注,以及对相关因素的一致性检验,在借助人工智能和大数据对文本本身进行更加全面的识别方面投入不足,从而导致相应的技术能力无法应对以“深伪(Deepfake)”为代表的伪造信息技术的发展。有研究者指出,“瑞士科学家在一篇论文中就首次对人脸识别方法检测Deepfake的效果进行了较为全面的测评,尝试用最前沿的人脸识别系统去识别假视频,结果错误率高达95%。所以当前如果要求平台对深度伪造等合成媒体内容进行识别和标注,在技术上几乎是不可能实现的” 。这一事实告诉我们,在网络传播中反虚假、反低俗,还是要更多依靠更加先进的人工智能应用,通过大数据与算法的结合,提升对各类内容(文字、图片、视频等)的识别能力。

当前的人工智能,实质上是基于对人类处理各种事务规则的算法化,并基于大数据提供的深度学习资源而实现的。具体地说,就是人们根据对于客观事物的认识,制定处理相关事务的规则和标准,然后找到一组数学公式来模拟这个过程,也就是形成算法,再把算法开发成为软件,就可以用大数据来训练这个软件学会识别不同状态和情况,达到比较成熟的水平就可以上线运营,代替人类来工作了。客观上,在这个过程中,关键性的难点在各个环节都存在。如人们制定的标准和规则是否科学,取决于人们对相关事物本身发展规律的认识水平。按照马克思的论断,“一种科学只有在成功地运用数学时,才算达到了真正完善的地步”。 这需要人们对客观规律有深刻的认识,目前在社会科学领域这显然是研究的短板。以笔者本人近年来对主流价值观如何体现为算法的研究为例,旨在面向个人推送信息以提高传播效率的算法,如何在社会成员个人对事件重要性的判断与社会主体对事件重要性的判断之间建立一致性就是一个难题。在内容审核方面,也存在标准和规则随具体场景而变化的情况,如越南战争期间著名的反战新闻照片,照片主体是一位越南小女孩衣服被汽油弹引燃而浑身赤裸奔跑,就曾经因为“裸露”, 被Facebook误删。实践中,即使实现了规则和标准清晰且正确,还要能够找到可行的算法,建立较大规模的数据库,还要有算力的支持。如灵犬3.0,就投入了更大的算力。从上述过程看,利用人工智能的深度学习来解决虚假、低俗内容充斥网络空间的问题,是一个具有相当技术难度的系统工程,需要假以时日,需要付出更大的努力。

用技术识别内容如此之难,是不是我们就不要走这条路,靠人工去完成这个工作呢?很显然,在互联网传播环境下,这是不现实的。当前,互联网技术的应用,已经实现了在传播的技术条件方面对用户的普遍赋权,在中国,每天都有数以亿计的互联网用户活跃在各个网络平台上,以短视频为例,抖音等平台,每天都有千万条级别的内容上传,今日头条平台每天经审核后发布的内容就超过60万条。这是无法完全用人工去处理的。与人工审核相比,机器审核的优势在于,机器一是计算快,一秒钟能执行百亿次计算;二是存储大,可以轻松存储千亿以上汉字;三是运行稳定,不会因心情、状态、对标准的理解等因素影响处理结果。据了解,由于强化内容标注和审核的需要,今日头条的母公司“字节跳动”已经建立了近万人的审核团队。在“机器+人工”审核模式下,我国主要的互联网信息分发平台的内容安全得到了较大程度的提升,未来随着研究的深入、技术的进步,内容审核的水平还会持续提升。

相关文章

幸福用电 生活上个大台阶

柴里煤矿:党员标杆树起来

枣庄供电公司市中客服分中心荣获全国

枣庄供电公司发布履责行动书

幸福用电 生活上个大台阶

带电改造配电台区获点赞


从小作坊到全省领先

工行枣庄分行圆满完成2017年年轻

工行滕州支行筑牢防线力促党风廉政建设

工行滕州支行强化安全工作为经营保驾

工行枣庄市中支行公司存款增长实现新

工行滕州支行推动国际业务实现稳定增长

工行滕州支行紧抓教管培养 力促青年


2小时劲销逾8成,王者之势众望所归

2小时劲销逾8成,王者之势众望所归

病魔无情,人间有爱

名模、乐队、机车云集中坚1878

“中坚一品杯”青少年才艺大赛决赛圆

中坚一品:墅质高层开盘即罄 再创枣庄


病魔无情,人间有爱

浪漫樱花季,一场盛大的花事

中央广场12月31日隆重开业 引万

枣建集团又一力作震撼呈现

深耕枣庄,中坚蝶变

中坚1878壹号公馆11月19日盛大开盘

我市举行2016秋季文化博览会曁首


东南汽车携手综艺大明星走进滕州!

东南汽车携手综艺大明星走进滕州!

颜·实力SUV东南汽车DX3滕州闪亮上市

动力升级 宝骏家用车劲入t时代

枣庄公布2016年第二批终生禁驾人

东风悦达起亚KX5在枣庄征骋革新上市


颜·实力SUV东南汽车DX3滕州闪亮上市

枣庄市公安局交通巡逻警察支队发布2

枣庄公布首批终生禁驾人员名单 50

我市进口机动车上牌手续简化

首场中央公车拍卖全部拍出 车牌号回

让纯电动汽车进入枣庄千家万户

凯翼汽车C3枣庄炫动上市


中考

中考市中区管制路段发布

中考

夏季高考成绩24日前公布

枣庄职业学院数控技术专业3+2

中高级会计职称考试12日起可补报


高考顺利结束

高考顺利结束

再见 高考

高考第二天 一鼓作气考场再战

高考进行时

高考首日,全民“动”起来

近2.7万人赴考


小长假来袭 会吃的你在全国各地用什

小长假来袭 会吃的你在全国各地用什

“世界爱眼日,爱眼公益行”活动在薛

李二锅大酒店华派广场店隆重开业

众筹助力健康蒸鲜食府蒸蒸日上

五种菜凉拌最营养


“世界爱眼日,爱眼公益行”活动在薛

牙齿有异味是疾病信号 牙龈出血暗示

每天最该喝水的十个时刻:饭后半小时

民营医疗机构数量占总数4成 诊疗人

商务部回应质疑:若艾滋病人进澡堂不

汤臣倍健被指不含胶原蛋白 回应称将

恒天然元气难复 质检总局短期内不会


5岁超萌“小学究”网络爆红 “00

三部门要求规范母乳代用品宣传和销售

中乳协推介六品牌国产婴儿奶粉 否认

妈妈摔倒瞬间 双手举起宝宝

养个孩子276万?为了孩子的教育你

国家发改委开出中国反垄断史上最大罚单


儿童春季食疗 应对三大常见病

5岁超萌“小学究”网络爆红 “00

国家质检总局责令31家企业召回缺陷

偷拿家中酒 卖钱买零食

宝宝得了湿疹 吓坏年轻父母

孩子是同学 家长成朋友

两代父母打起育儿战


抓住最后一个小长假!这些海岛人少景也

山亭率先推行景区价格争议调解员制度

小小蝴蝶谷带来公园大人气

抓住最后一个小长假!这些海岛人少景也

硕果飘香迎远客

我市全力打造“鲁风运河”文旅目的地


特色帐篷亮相山东蒙山

暑期台儿庄古城迎客逾110万人次

好客山东首届无人机旅游航拍大赛在山

薛城:以红色旅游助力全域旅游发展

特色帐篷亮相山东蒙山

抱犊崮风景区获1000万国家资金补助

滕州微山湖湿地四措力促景区升级


薄板泉村遗存百年炮楼

薄板泉村遗存百年炮楼

曹山顶惊现百年石城墙

聆听远古的声音

百年地契

你好,“活着的运河古城”


曹山顶惊现百年石城墙

走薛河:沈玉荣 “红嫂”支前“救八

传播文明的使者

山泉瀑布引游客

情洒翼云山

走马水泉探风物

薛河渔家

枣庄论坛热图
枣庄新闻网版权与免责声明

枣庄新闻网版权与免责声明:
① 凡本网注明“稿件来源:枣庄日报、枣庄晚报、本站原创”的所有文字和图片稿件,版权均属于枣庄日报社和枣庄新闻网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。经本网协议授权的媒体、网站,在下载使用时必须注明“稿件来源:枣庄新闻网”,违者本网将依法追究责任。
② 本网未注明“稿件来源:枣庄日报、枣庄晚报、本站原创”的文/图等稿件均为转载稿,本网转载出于传递更多信息的目的,并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的“稿件来源”,并自负版权等法律责任。如擅自篡改,本网将依法追究责任。如对稿件内容有疑议,请及时与我们联系。
③ 如本网转载稿涉及版权等问题,请作者来电或来函与枣庄新闻网联系。
※ 联系电话:(0632)8166090

   枣庄
24小时排行 /热帖

报社概况| 枣庄新闻网网站介绍| 版权声明| 广告服务| 联系我们| 设为首页 | 加入收藏

 

本网站所刊登的各种新闻﹑信息和各种专题专栏资料,均为鲁南在线版权所有,未经协议授权,禁止下载使用。
鲁ICP备05043501号|鲁新网备案号:201063202

分享按钮