在人工智能技术飞速发展的今天,
无论是金融、医疗还是新零售,
几乎各行各业都在享受着科技发展带来的红利。
现在许多类似“媒体大脑”的人工智能产品已经开始广泛服务于媒体运营建设,除此之外,机器学习技术还能够以怎样的形态赋能新媒体呢?
为此,先荐在今年的2050大会新生论坛上召集了一批媒体行业资深人士和人工智能领域技术专家,共同探索AI赋能新媒体的技术落地新趋势。
01 人工智能技术在媒体领域的落地情况
媒体作为人工智能技术在媒体行业重要的应用领域,其生产方式的智能化已经在很多场景落地,阅文集团智能业务中心负责人陈炜于表示,阅文集团的“内容大脑”平台已经具备从内容生产、内容审核、内容签约、内容消费、内容增值的技术能力,无论从技术架构还是从核心的内容理解能力上,都已经形成了比较完备的体系。
数据整合、知识挖掘、知识表示和知识应用四部分组成了“内容大脑”平台的技术架构。在数据整合阶段,平台根据站内小说、用户评论、内部知识等信息进行规则提取并创建基础信息库,通过NLP技术挖掘信息点,结合行业知识生成阅文知识图谱。在知识表示阶段,搜集到的信息将清晰地以图谱形式呈现并梳理,并导入到知识应用层面。
目前,根据从生产分发到消费增值等一系列业务需要,这种技术已经被广泛应用到集团旗下小说类平台(起点中文网等)的网文内容建设中。
同时,陈炜于充分肯定了人工智能技术在内容平台的战略地位,并肯定了以内容为核心的IP价值: “网文的价值可能是1,但是IP的价值可能是100,内容是值得我们投入的。”
同样对人工智能技术已有较成熟应用的还有封面传媒,封面传媒总经理助理&数据研究部总监徐桢虎认为,深度改变传播、AI赋能以及新技术的结合才是媒体智能化的目的。封面传媒用了一年时间完成从“纸媒”到“智媒”的蜕变,无论搜索还是资讯,其客户端在智能化发展过程中对用户画像特征的利用都显而易见。
在产品智能化应用中主要分为三个模块,一是NLP应用,包括新闻推荐、搜索、敏感词、分类、摘要、知识图谱,二是视频应用,包括视频理解、视频审核、视频标签体系、短视频制作;第三就是内容生产自动化,涵盖三审三校、纠错、标签优化、考核打分等。技术应用层面,AI落地成果也显而易见,封面新闻app上的小封机器人写作专栏,目前可写作文章包含10+大类和40+小类。2018年世界杯期间,app相关资讯推送几乎全由机器自动完成,总共推送600多篇,全网总阅读量过亿。
封面传媒业将其MGC机器写作视频生成系统应用于财经金融和突发报道的写作中,徐桢虎表示:“视频理解、AI辅助创作、内容传播创新是目前的三个主要研究方向,我们希望塑造国内智媒体标杆,技术产品化和应用平台化是我们接下来的努力方向。”
02 数据赋能媒体还有哪些可挖掘的契合点?
数据作为人工智能技术实现的基础单位,在5G时代也将为人工智能赋能新媒体带来更多的可能性。新华智云“媒体大脑” 从报表、bi、简单的分析挖掘的“数据仓库”,到单平台支持更大的数据量、更多的数据形式的“数据平台”,再到如今数据能力建设和服务化,赋能业务的“数据中台”的技术迭代,赋予了数据更多的职能。
媒体数据中台90%以上存储非结构化数据,数据处理过程算法占比高,外部数据占比更大,数据来源渠道也更为多种多样。“如今媒体更关注数据的时效性,因此平台要具备更快速的处理数据的能力。”汇集能力、文本内容和视频内容的识别能力、数据主题、计算能力以及推荐等服务能力是媒体数据中台现阶段重点建设的几大能力。“媒体进入全渠道与全流程时代,流量不再是问题。”新华智云首席数据官李金波认为:“内容将趋向视频的表现形式,内容和技术的边界也将越来越模糊。”
AI不仅在媒体建设方面表现卓越,而且对媒体运营领域的赋能也有很大突破,五彩传媒创始人陈旸将机器人助手运用到社群运营当中,数据增长也同样显著。机器人助手具备数据分析、广告监测、关键词回复、签到、智能陪聊等功能,专注于内容传播变现技术,为知识型社群提供安心服务。
“AI+Media的主人是客户,而AI和Media只是工具,如何利用好这些工具给他们带来用户增长和GMV才是最主要的。”陈旸认为,AI现阶段最大价值在于自动化连接,而非内容生产。因此他更关注通过AI打通与用户之间的通路,完成用户获取、数据分析和及时反馈的用户体验。
03 深度学习技术如何赋能新媒体?
深度学习技术目前在媒体范围的应用主要集中在内容生产和内容分发两大块,其中内容分发已经实现并发展出较成熟的技术架构和商业体系。作为第四范式资深科学家,王嘉磊在主题分享《如何通过AutoML实现智能推荐系统的自动上线和运维》中介绍了AutoML技术如何使AI具备自我完善和演化的能力。
目前通过NLP技术感知文本内容(word2vec, doc2vec, BERT, etc.),通过CV技术感知图像、视频,使用机器学习分析用户画像并预测点击率和内容阅读时长,和使用机器学习评估内容质量并促进优质内容的传播是AI技术在推荐系统中的主要应用方向。而目前在技术上其实面临着两大挑战:一是在机器学习模型的构建流程中,每个环节都需要建模专家根据经验做出选择和优化;二是系统上线后为保证效果,还存在一定数量的系统参数需要人来持续监控和优化。
如果需要解决这两大难题,则需要将AutoML运用与推荐系统的搭建,即用AI来训练AI模型,通过进化算法、贪心法、贝叶斯优化、强化学习四大AutoML搜索策略,实现自动特征工程、模型超参数优化、神经网络结构搜索以及在线调优。
“训练神经网络本身是一件比较困难的事情,往往生成出的网络结构数据在具体场景不一定适用。”王嘉磊表示,“我们希望能够做自主的神经网络结构搜索,希望效果会比一些从学界直接拿来的现成网络有所提升。”
随着人工智能技术的升级发展,AI将不断从媒体的内容生产、分发与消费模式等环节实现智能突破,从而帮助媒体进行内容升级和用户体验升级。作为一家技术与服务提供商,第四范式很早就看到了人工智能给媒体带来的“智能化”意义,其推出的AI产品“先荐”以智能推荐为核心切入点,集内容上传、内容管理、内容分发、推荐干预、前端渲染于一体,可以帮助媒体从0到1搭建推荐系统。据悉,目前先荐已与人民日报、环球网、CSDN、花瓣网、段友、36氪、简书等三百余家内容平台展开合作,多次成功助力媒体实现智能转型。