大数据时代下移动广告的精准营销
一、 研究意义和价值
大数据是时下最热门的科技词汇之一,几乎所有企业都在寻求数字化时代下向大数据变革转型之路。它就在我们每个人身边,当你有意无意的打开微信,刷一条朋友圈,点开个链接去浏览一条热门新闻,又或者打开淘宝去搜索购买一件你心仪已久的物品,这些无意识数据都被跟踪和记录。十分平常的行为,其实已经在告诉别人,你是谁,你来自哪里,你想要什么。这些行为背后隐藏的信息被远远的掌握着这些无意识数据跟踪记录,并在适时推送。通过用户行为分析实现精准营销,是大数据的典型应用,通过分析热点店铺和热点商品的销售行为过程来为卖家营销手段做数据依据。通过对各个业务块数据进行整合和深入挖掘产生用户画像,了解客户喜好和爱好等,为他们匹配想要的物品、出行、服务等。通过数据分析为用户提供有价值的服务。
二、 主要参考文献
三、 设题内容和具体方案
四、 论文大纲
五、 工作进度安排
1、 文献调研
2、 资料搜集
3、 技术分析‘
4、 方案分析
5、 撰写论文
六、 预期结果
大数据技术的演进与应用
大数据是时下最热门的科技词汇之一,几乎所有企业都在寻求数字化时代下向大数据变革转型之路。但大数据在很多人眼里还是层层迷雾,众说纷纭,用一个简短的例子来说什么是大数据?早在2006年,google就提出了云计算的概念,用它来计算海量的微博数据,而且自从有了云计算服务器海量的数据,才有了它可以运行的轨道,大数据的概念也才应运而生,那么大数据究竟有多大呢?打个比方,我们把2013年全球互联网上流通的数据都刻成光盘,把光盘堆成五堆,那么每一个的高度就相当于从地球到月球之间的距离,其实大数据并没有这么神乎,他就在我们每个人身边,当你有意无意的打开微信,刷一条朋友圈,点开个链接去浏览一条热门新闻,又或者打开淘宝去搜索购买一件你心仪已久。十分平常的行为,其实已经在告诉别人,你是谁,你来自哪里?你想要什么?这就让那些在背后隐藏的、远远的掌握着这些无意识数据的那些人的价值体现了出来。
一, 什么是大数据
大数据指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到攫取,管理,处理,并整理成为帮助企业经营决策更积极目的的资讯,大数据指不用
随机分析法,抽样调查这样的捷径,而采用所有数据的方法。首先它是数据的拥有着,大数据是基于数据本身的公司的业务核心,这些公司对大数据的重复利用作为盈利的主要手段,其次它是产品和技术的提供者,主要为客户提供包括分布式数据存储处理,数据挖掘及可视化工具在内的标准化大数据产品或整体解决方案;最后,它是服务的提供者,主要基于思维的、挖掘数据价值的大数据应用厂商,比如向企业、部门以及个人提供数据服务。大数据说互联网时代的信息技术,但不仅是技术,而是一种技能,一种能够从海量数据中去发现价值的技能。大数据是一种思维方式和改造认知社会的工具,推动社会不断进步。
大数据能够干啥?事实上,当很多人仍然把微博等社交平台当作抒情,或者发表议论的工具时,华尔街的敛财高手们,却正在挖掘这些互联网的数据财富,先人一步,用大数据预判市场走势,而且取得了不俗的收益,比如说华尔街根据民众情绪抛手股票,银行根据求职网站的岗位数量推断就业率,美国疾控中心根据网民搜索,分析全球范围内流感等疾病的传播状况,对冲基金根据网购网站顾客评论分析企业产品的销售状况,投资机构搜集并分析上市企业声明,从中寻找破产的蛛丝马迹,奥巴马的竞选团队依据的微博,实时分析选民对总统竞选人的喜好。
二, 大数据的四大特性
1. 数据体量大(Volume),从印刷到音频,全球的数据在不断增长。大数据具有非结构化数据的超大规模,增长总数据量的80%到90%,比结构化数据增长快10到50倍,是传统数据仓库的10到50倍。
2.1.1 更大的数据集
Professoe Joseph Hellerstein曾说过“我们正在步入信息时代,这个时代的绝大部分数据由软件日志、照相机、麦克风,RFID阅读器,无线传感器网络等机器标志,这些机器产生数据的速度远远超过人们现有的处理能力,因为他们的数据产生速度遵循摩尔定律”。当今社会大数据具有更大的数据集,规模都是PB级别的。而这个PB集是有多大?中国的数据发展从1998年开始的2000年开始学习发展,在2003到2006年为萌芽期,中国的大数据发展非常低,数据库最大容量才达到250TB,这个阶段主要的业务应用就是搜索引擎;2006年到2009年为突破期,数据库最大的容量达到了500T,各大互联网公司采集用户访问互联网的行为数据,对用户进行画像,并根据用户画像向用户进行广告营销;到2010年,数据库最年大的容量达到了1000TB,是大数据应用爆发式增长阶段;如今,之后大数据每次增长都是PB级的,出现各种基于大数据行业应用解决方案,大数据的应用驱动社会向更加智慧的方向发展,都得益于大数据高效处理海量数据的技术,并通过这些技术产生价值。
KB>MB>GB>TB>PB>EB>ZB>YB>NB>DB
(1KB=1024MB,1MB=1024GB,1GB=1024TB,1TB=1024PB。)
2.1.2 更多的智能算法 可以通过OLAP数据集来描述数据通过交叉表的可视化/聚合在不同的粒度级别
2.1.3 推理/机器学习
马云再一次演讲中说道,“2008年初,阿里巴巴平台上整个买家询盘数急剧下滑,欧美对中国采购在下滑。海关是卖了货,出去以后再获得数据;而我们提前半年时间从询盘上推断出世界贸易发生变化了。”马云对未来的预测是建立在对用户行为分析的基础上,通常而言,买家在采购商品前会比较多家供应商的产品,反映到阿里巴巴网站统计数据中,就是查询点击数量和购买点击的数量会保持一个相对的数值,综合各个维度的数据,可建立用户行为模型,因为数据样本巨大,保证用户行为模型的准确性。因此马云在分析中说
道,询盘数据的下降,自然导致买盘的下降。
通过对比数据不断地调整模型和参数,计算可行性分析,来直接捕获人口的基本属性。
大数据不仅仅是大,比大更重要的是数据的复杂性,有时甚至大数据中一条小数据,如一条微博就具有性的价值。
2.多样性(Variety),数据类型繁多,大数据的异构和多样性,大数据具有很多不同种形式,包括客户资料、话单、网络日志,使用文本,图像,音频,视频,地理位置信息,机器数据的形式,无规模或者是模式不是很明显,不连贯的语法或语义等多类型数据对数据的处理能力提出了更高的要求。多样性,企业内部的经营交易信息,物联网世界中商品,物流信息;互联网世界中人与人交往,交互信息,位置信息等是大数据的一个主要来源。能够在不同的数据类型中进行交互分析的技术,是大数据核心技术之一,语义分析技术,图文转换技术,模式识别技术,地理信息技术,都会在大数据分析时获得应用。
3.商业价值高(Value),大数据中蕴含的商业价值可以指导人们洞察当下行为、预测未来行动。大量的不相关信息,对未来趋势与规模的可预测分析,深度复杂分析,如机器人,人工智能,VS传统商务智能(咨询,报告)。价值密度上,为了一颗金子需要保存全部沙子,大数据,挖掘大数据的价值,类似于沙里淘金,从海量数据中挖掘稀疏但珍贵的信息,价值密度低,也是大数据的一个典型的特征。
4.处理速度快(Velocity),实时分析,而非批量式分析,数据输入,处理与丢弃,立竿见影,而非事后见效。在海量数据面前,处理数据的效率就是企业的生命,速度,一秒是临界点,对于大数据应用而言,必须得一秒内形成答案,否则处理结果就是过时和无效的。实时处理的要求是区别大数据应用和传统数据仓库技术,BI技术的关键区差别之一。
三, 大数据分析方法
1.可视化分析,大数据分析的使用者,有大数据分析专家,同时还有不同用户,但是他们爱着对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观地呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。
2.数据挖掘算法,大数据分析的理论核心是数据挖掘算法,各种数据挖掘的算法,际遇,不同的数据类型和格式,才能够更加科学地呈现出数据本身具备的特点,也正是因为这些被全世界通缉学家所公认的各种统计算法(可以称之为真理),才能深入数据内部,挖掘出公认的价值,另外一方面也是能够因为这些数据挖掘的算法,才能够更快速的处理大数据,如果一个算法,得花上好几年才能得出结论,那么大数据的价值也就无从谈起了。
3.预测性和分析能力,大数据分析最重要的应用领域之一就是预测性分析,从大数据中挖掘出特点,通过科学的建立模型,之后便可通过模型带入新的数据,从而预测未来的
数据。
4.数据质量和数据管理,大数据分析离不开数据质量和数据管理,高质量的数据和有效的数据管理,无论是在学术领域,还是在商业应用领域,都能够保证分析结果的真实和有价值,大数据分析的基础就是以上四个方面,当然,更加深入大数据分析的话,还有很多很多,更加有特点,更加深入更加专业的大数据分析方法。
常说云计算彻底改变IT,大数据彻底改变业务。云计算本身也是大数据的一种业务模式。腾讯在天津投资建立亚洲最大的数据中心,百度也在投资建立大数据处理中心,新浪推出企业微博产品,提供精准的数据分析服务。在商业业务过程中,商业模式的驱动推动了应用需求驱动。同时,应用需求驱动又促进商业模式的驱动,两者相互推动相互促进。但是管理大数据易,理解大数据难,目前大数据管理,多从架构和并行等方面考虑,解决,高并发数据存取的性能要求,解数据存储的红线扩展,但对非结构化数据的内容,理解仍缺乏实质性的突破和进展,这是实现大数据资源化、知识化、普适化的核心。非结构化海量信息的智能化处理,资源语言理解,多媒体内容理解,机器学习等。
利用用户行为,指纹创造新商机,用户在线的每一次点击,每次评论每个视频点播就是大数据的典型来源,互联网企业之所以取得令人瞩目的成绩,其核心的本质就是包括用户网络操作的大数据,进行记录和分析,形成用户行为指纹,从而洞悉用户的潜在的,真实的需求,形成预判,这是传统企业花费重金都难以企及的梦想,所有传统的产品公司都只能沦为这种新型,用户平台级公司的附庸。
大数据组成和展现方式。新模式和新技术,新平台技术,不同范围服务,新的传播方案。
四, 大数据的应用
1. 大数据的客户体验 客户是谁?客户体验是什么?
2. 大数据的产品化思维 简约 极致
3. 大数据的平台思维 如何标准化?构筑共赢生态圈 大数据首先要解决自己的产品化问题;通过平台思维,大数据会逐渐减量起产业发展所必须的生态圈。
4. 大数据的迭代思维 消除着眼,微创新 精益创业,快速迭代 “互联网+”已经成为未来中国国家发展目标。在此过程中,大数据也会依附“互联网+”完成一次将智慧嵌入传统产业的过程。
大数据的应用
从互联网+到大数据x
1. 互联网+政务
电子政务的信息孤岛,管理本位、效率利用等问题,通过深化大数据等新一代信息技术解决,从而建立开发、透明、服务的,实现治理能力的现代化。
2. 互联网+民生
移动互联网促进的“智慧民生”使得大家可以通过手机就能便捷的获取各种服务,优化公共资源配置,提高社会整体效率。
3. 互联网+金融
互联网与金融的结合掀起了全民理财的热潮,低门槛与便捷性让资金快速流动,大数据让征信更加容易,P2P与小额贷款热度非凡。
4. 互联网+媒体
打造基于大数据的信息资源平台,重建用户连接,利用在本地的深度覆盖和垂直行业支援,重新获得互联网+下的信息入口价值。
五, 大数据的重要性
大数据的应用不仅仅是精准营销,通过用户行为分析实现精准营销,是大数据的典型应用,但是大数据在各行各业,特别是公共服务领域具有广阔的应用前景。通过分析热点店铺和热点商品的销售行为过程来为卖家营销手段做数据依据。淘宝指数、数据魔方和超级数据均是为淘宝卖家提供的商业分析工具。淘宝指数可以显示出淘宝产品的长期走势,分析人群特性,了解成交排行,对不同标签的人买过什么产品进行细分。
例如,基于出租车数据,只能获取城市居民特定出行目的的信息,会过低估计通勤出行的比例。“大数据”并非是“全数据”,在研究中,需要对于数据的代表性要有充分认识,处理大数据的代表性问题的一个可能的途径是集成[…]
摘自:地理学碰上“大数据”:热反应与冷思考
整个数据平台是按照基础平台、核心应用、产品包装和质量监控的思路分为四部分:
数据中心,负责建设管理腾讯大数据基础平台;
精准推荐中心,负责研发落地以数据挖掘为核心的大数据应用;
产品中心,负责大数据产品的策划和运营;
质量中心,负责我们的质量监控与保障。
要说腾讯的数据情况,得从不同的业务说起。其中主要包括以下5种:
即时通信QQ活跃帐户数达到8.29亿;QQ智能终端月活跃帐户数5.21亿
即时通信QQ最高同时在线帐户数达到2.06亿
“微信和WeChat”合并月活跃帐户数达到4.38亿
“QQ空间”月活跃帐户数达到6.45亿;QQ空间智能终端月活跃帐户数4.97亿
增值服务付费注册帐户数为8800万
从这些数据可以看到,腾讯每天的数据量是一个天文的数字,目前最高日接入消息条数10000亿 ,日接入数据量200TB,并发分拣业务接口10000个。