数据挖掘现已产生了巨大的社会经济价值,但这个行业的能量释放才刚刚
Business Review I Z J
商界评论
I r)n
大数据勺人I+.智能时代即将到来之际, 我们该如何拥抱时代?
6川丨H,曾与屠呦呦等人一同q选“2015年 度中W十大科技创新人物”的电子科技大学周 涛教授,在西南财经大学召开了主题为“大数
据能力的矛盾是大数据时代的第一个挑战:
因此,现在大M的商业模式都是为了解决 这个矛盾,比如珣当网推荐一本书,网易云音乐 推荐一首歌,或者珍爱网推荐一个相亲对象
二是数据形态发生了巨大变化
周涛
电子科技大学大数据研究中心 主任
___________________》末来企业在做大数据、人工智能 的创新实践上,需要强调4点核心: 规模化、自动化、客观化、定矍化。
据与人丨:智能创新实践”的公开论坛周涛教 授以实操的大数据项H为例,为听众讲述了最 前沿的大数据创新实践情况。以下内容经《商 界评论》现场实录整观及其历史演讲补充:
何为数据
在开始前,我想问大家的一个问题:什么 是数据?
多数人认为,有了计算机之后小有数据, 其实早在计算机之前我们就有了数据
我们认为,数据就是将来可以为我们做定 量分析的记录它是事实或观察的结果,是对 客观事物的逻辑n纳,是用于表示客观事物的 未经加r.的原始素材
在淘宝匕有大M的售卖记渚,通过这些 售卖记斌我们能够知道,生活在成都的30岁左 右的女性用什么化妆品.成都独特的天气情况 使她所用的化妆品和』1:他省市的不一样,这是 挖掘到的数据。
但是,有了这些数据不等于就ft有价值, 我们还要通过数字广tt、个性化推荐等方式, 帮助用户史'快找到喜爱的商品,同时也帮助商 家提高广告点击M和商品购买量,减少库存压 力,这样才能产生价值。
现在我们已经站在了大数据时代的门口, 其中一只脚已经跨r进去,并且有3种趋势在推 动我们的发展:
一是数据总量的增长
现在全世界数据存储量是20个ZI5,再过8 年这个数据a可能要增加丨〇倍。
2018年底,淘宝的单品数首次超过了中国 的人11数,单品数设达到了 15亿之多面对这 15亿个单品,别说用户想逐个挑选,仅仅只是 看一遍都很难,这种数据爆炸和涔通人分辨数
以前我们处理的绝大部分数据都是表格类 数据,现在绝大部分新增数据都是非结构化数 据,包括认知、时间、序列、语音、文本、图像、 空间轨迹、人与人之间的社夂网络,这些数据 背后蕴藏着巨大的价值。
T•机是最大的个人传感器,仅仅利用手机
的GPS轨迹数据,就可以定位用户H.体位置,其 至锁定不超3、>:方米的空间范m
凭借这点,我
们可以知道一个R7生人的家住在哪里,其是否 在工作,经常在哪里吃饭,有没有去过高 级会所等。
这杵数据的保护在很多地方都不严密.除 了丁机运营商和通管局之外,许多手机应用丨 都有用户的全M轨迹数据,这带来了第二个挑 战,就是在安全隐私可控的前提下如何挖掘这 些非结构数据的价值
•:是数据的组织结构发生变化
原来的数据都是孤岛,淘t知道我买了什 么货,新浪微博知道我说了什么话,门诊知道 我得了什么病,门知道我犯了什么罪,但 是这些主体相互之间却不知道.淘不知道我 得r什么病,新浪微博不知道我犯r什么罪。
把数据流动,从而围绕个人、企业、产品、 终端、痛点全方位n像,这也带来了第三个挑 战,就是如何发挥大数据1+1远大于2的价值:
数据的价值
'年有一天我们真正进人到大数据时代,可 以明显体会到数据的3大特征:
一是数据的外部化。数据有一个天然的共 性,就是它能够流通共享,容易被拷贝,a几乎 不耑要其他成本我们在a处产生的数据不仅 能在A处发挥作用,还能在BCD处发挥作用
二是人r.智能我们能够用到人I:智能的
30 I STRATEGY大道®管见
Holo Credit可将企业的风险评估实现自动化,帮助银彳5进行自动化信货审批决策。
企业工商信息、关联方信息、司法诉讼、 行政处罚、资质、招投标、招聘......
税务、社保、公积金、房产、水电.
企业征信(授权)、企业主征信(授 权)、银行流水......
订货等交易流水数据、应收账款数据、生 产经营数据......
关键技术,比如数据挖掘、机器学习等,去得到简 单统计分析所得不到的洞见,再用这种深刻洞见 来指导我们进行高效准确的决策
^三是价值采集数据、存储管理、安全隐私控 制都需要成本,大数据时代中.每花费100元就要 产生200元以上的数据价值;
其中数据能够产生4个价值:支撑决策、优化 生产、提升销售和改善生活。
接下来我们通过2个大数据应用的实践案例, 来看看目前数据能为我们产生哪些价值。
第一,基于大数据的机器学习在餐饮业的应用。 现在的网络餐饮服务存在大量的食品安全问 题,比如用户在某网络订餐平台的餐饮店A订餐,而 实际制作食物的并不是A店,而是一家黑作坊,没有 店面,更没有证照,存在严重的食品安全问题:
为了解决这个问题,我们用机器学习的方式, 制定了网络餐饮服务的监管办法,主要解决两大 问题。
1.我们要对网络餐饮店的证照进行分析,针 对这个问题首先耍判断餐饮店有没有h传证照, 随吋监控哪些餐饮店是没有h传的,并把它清理 出来:
然后,识别证照不清晰、、一证多用、证 件和T商注册不匹配、跨范闱经营的餐饮店通 过机器学习,计算机能够ft动迅速、准确地识别 出这些有问题的餐饮店
基于这一步,我们发现成都市不合格的网络 餐饮店大概占70%,通过持续监测和整改,把不 合格率降到了 30%。
2.我们要解决的根本问题是要老百姓吃到放 心安全的食品。
我们获取餐饮店的消费荇评论的数据,并且 把当中和食品安全强相关的数据来指导机器学 习,进而对餐饮店进行监测
如果监测到某餐饮店有大量的有关食品安 全的评价,比如有蟑螂、老鼠、吃了拉肚子等,那 么这家店就肯定有问题
第二,大数据在工业领域的应用。
全球工业4.0大概经历4个阶段.从机械化到 自动化到信息化再到智能化在未来会形成智能 工n就等于一个智能中台,可以分成可视化层、 执行层、工业大数据层、设备局连接层。
刀具加丨〔工艺(如铣、削、钻)在汽车、飞机 和模具制造中应用广泛如富士康,每年用在刀
Business Review I ) I
商界评论
I
具h大概150亿元。这种背景下,刀具何时失效,
»数字工厂(DF)是在计算机
做r一些信息化的统计展示,并不是真正意义卜. 的数据化我们现在很多数据I:厂项M都没有太 大的实际价值,无法为工业、生产提供实际性效 率提升,还处于初级阶段。未来下一步就是怎么 如何判定成为降低企业成本的大问题。
刀具在加工过程中随着加工时间的增加,自 身的磨损程度也随之增加。当磨损量达到一定 虚似环境中,对整个生产过程 进行仿真、评估和优化,并进 —步扩展到整个产品生命周期 的新型生严组织方式。
程度时,甚至还会出现断刀、崩边等严重磨损现 象,进而导致刀具失效。在缺乏有效的刀具磨损 监控、预测方法时,刀具磨损不但会增加生产产 品的次品率,同时也会给安全生产造成隐患。
目前大多数刀具供应商对生产出的刀具寿 命进行如下估计:对刀具进行压力测试,测出刀 具平均极限寿命,在此极限寿命基础之上.一般 按照80%比例折算成刀具寿命。
如果使用单位依照刀具供应商提供的建议 进行刀具管理,每把刀将损失约20%的寿命。
再加上测试环境的不同,刀具供应商提供的 刀具寿命还会进一步受到实际T况的影响,其 参考性进一步降低。
我们在数控机床的电缆卜.加一个霍尔传感 器,利用霍尔效率来测微电流,电流信号经数据 采集器(DAQ)传送至工控机。
有条件的情况下,可以通过高速摄像头采集刀 具的图像信号;通过数控机床自带或侵人式的传 感设备,采集压力、振动、热度、声音等其他信息。
工控机持续不断地接收来自数据采集器的 电流信号,能够对不同机床的实时信号进行监 控、分析和预测,并在必要时发出报警信号或其 他辅助信号.如向自动换刀系统发送换刀信号。
以常州某科技公司为例,其近千台机床制造 f•机壳,每台机床每年消耗5 000把铣削刀具,每
年累计消耗近500万把我们通过检测铣削电流 的稀疏贝叶斯学习,对每把铣刀的寿命进行预 测,每年可为其节省约M乙元。
金融的未来
未来许多岗位或许会被机器人取代,比如法 务r作人员、会计师、检验科医生等。
这些工作理论h都可借助机器的深度学习算 法完成,但要完全实现却没有理论丨:这么简单。
现在大家看到很多r业大数据,实际上只是
再往前走一步,提高生产效率,把产品做好
对于金融行业来说也是如此,我们要深化金 融改革,加强金融监管,科学防范风险,管理好3 大系统:
1.
信用。首先,建立信用体系。没有倍用记录
的企业和项目,用自动化大数据的方式建、>:可靠 的金融记录。
其次,交叉验证有信用记录的企业和项冃, 利用智能化的建模方式进行交叉验证、f彳动化、 非人工地验证信用质量:
2.
风险。传统风控的痛点是:成本高、静态
化、主观判断。
金融的核心风险是:信用风险、市场风险、操 作风险。
而信用风险管理能力、信用风险成本是影响 资产价格和利率的基础=
3.
共识金融风险的管理框架未来可以视一种基础设施,形成国际化的信用共识我们要 做到自动化的信息采集与资产质tt评佔、令息化 的企业和项冃W像、动态的企业倍川if价
比如我们跟贵阳银行合作项冃——
贵烟贷,
在掌握市场进销存数据的基础h,对供应链做整 体把控,通过风险控制降低坏账率.史是一年之 内让贵阳本地经销商的拿货量提高9%
并FI金融机构还可以通过数据检测来评估 企业的经营状况I:
假如申请信贷的企业是一家设备厂商,单纯 看市占率、荇收规模无法全面评估信贷风险我 们可以通过招聘网站h企业的招聘规模缩减,公
司员T.是否大规模更新简历,是否有行政处罚, 招投标成功率等企业行为数据分析,数据分 析,银行征信数据分析等,进行综合考敁H
[编辑苏冶 E-mail: sjplsiiye@163.com】
作