欢迎来到安全人之家! | 帮助中心 安全生产文库,专业安全资料网站,助力安全生产管理!
安全人之家
全部分类
  • 安全课件   操作规程 >
  • 安全管理   安全标准 >
  • 应急预案   事故案例 >
  • 安全教育   安全讲话 >
  • 安全资料   法律规范 >
  • 安全技术   安全视频 >
  • 安全文化   安全常识 >
  • 建筑安全   安全动态 >
  • 安全素材   精品资料 >
  • ImageVerifierCode 换一换
    首页 安全人之家 > 资源分类 > PPT文档下载
    分享到微信 分享到微博 分享到QQ空间

    大数据前沿技术与应用场景_V1.20180409(37页).ppt

    • 资源ID:322725       资源大小:1.66MB        全文页数:37页
    • 资源格式: PPT        下载积分:7.18金币     免费下载
    微信登录下载
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: QQ登录
    二维码
    扫码关注公众号登录
    下载资源需要7.18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝扫码支付    微信扫码支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    大数据前沿技术与应用场景_V1.20180409(37页).ppt

    大数据前沿技术与应用场景,大数据前沿技术,1,2,大数据应用场景,大数据的引擎,软件改变世界,软件是大数据的驱动力,Hadoop十年,大数据技术的关键历史进程,2000,2003,2004,2006,2008,2009,Google File System,Google MapReduce,Google Big Table,Hadoop开源,HBase开源,Hive,2010,MongoDB开源,Spark开源,2011,2012,2013,Hadoop1.0(HDFS、MapReduce),Storm初版,阿里巴巴 RocketMQ,Hadoop2.0(YARN),2016,Apache RocketMQ,2017,2018,Hadoop3.0,Storm1.0,2015,HBase1.0,2014,Apache Spark,大数据常用的关键技术,海量数据存储技术,分布式文件系统,是Hadoop项目的核心子项目,面向列的开源数据库,非常适合非结构化数据,是非关系数据库中功能最丰富,最像关系型的,拆分,复制,文件存储,列式存储,分区存储,文档存储,employees:firstName:Bill,lastName:Gates,firstName:George,lastName:Bush,其他存储技术,分布式索引技术,百亿级数据秒级查询。,分布式消息队列,融峰缓冲的必备利器。,Apache RocketMQ是开源的、分布式的、消息和数据流平台,生产者消费者模型,生产者向1个或多个消息主题生产消息,生产者和消费者彼此不知道对方,0或多个消费者可能对消息主题感兴趣,异步处理,将不必要的业务逻辑,进行异步处理,从而达到提速的目的。,150,110,65,应用解耦,解除不同系统或模块之间的耦合。,如果库存系统无法访问,则会导致处理失败,而影响下单。,即使下单时库存系统不能正常使用,也不会影响正常下单。,消息队列一般都内置了高效的通讯机制,可用在纯通讯场景。,消息通讯,融峰缓冲,消息队列最常用的应用场景。在秒杀或团抢场景广泛应用。,流量瞬间暴涨,引发服务故障。,可以缓冲高压,灵活处理请求。,分布式索引技术,百亿级数据秒级查询。,数据计算处理技术,分布式计并行算框架,适合时效性较低场景。,一种通用的计算框架,适合时效性较高场景。,流式计算框架,非常适合需实时计算的场景。,伪实时,外部存储,外部数据,Spout,Bolt,T,T,T,T,T,T,T,实时,数据分析技术,数据可视化技术,大数据前沿技术,1,2,大数据应用场景,商品零售大数据,有一位父亲怒气冲冲地跑到塔吉特卖场,质问为何将带有婴儿用品优惠券的广告邮件,寄送给他正在念高中的女儿?然而后来证实,他的女儿果真怀孕了。这名女孩搜寻商品的关键词,以及在社交网站所显露的行为轨迹,使沃尔玛捕捉到了她的怀孕信息。模型发现,许多孕妇在第2个妊娠期的开始会买许多大包装的无香味护手霜;在怀孕的最初20周大量购买补充钙、镁、锌的善存片之类的保健品。最后塔吉特选出了25种典型商品的消费数据构建了“怀孕预测指数”,通过这个指数,Target能够在很小的误差范围内预测到顾客的怀孕情况,因此Target就能早早地把孕妇优惠广告寄发给顾客。,大数据+政治,在筹备过程中,奥巴马背后的数据分析团队一直在收集、存储和分析选民数据。在这次的大选中,奥巴马竞选阵营的高级助理们决定将参考这一团队所得出的数据分析结果来制定下一步的竞选方案。利用在竞选中可获得的选民行动、行为、支持偏向方面的大量数据。比如,在东海岸找到一位对女性群体具备相同号召力的名人,从而复制“克鲁尼效应”并为奥巴马筹集竞选资金。“Twitter的政治指数”提供了一个衡量社会化媒体平台的用户如何评价候选人的方式。奥巴马积极的情绪指数是59,而罗姆尼的只有53。,证监会大数据,回顾“老鼠仓”的查处过程,在马乐一案中,“大数据”首次介入。深交所此前通过“大数据”查出的可疑账户高达300个。实际上,早在2009年,上交所曾经有过利用“大数据”设置“捕鼠器”的设想。通过建立相关的模型,设定一定的指标预警,即相关指标达到某个预警点时监控系统会自动报警。而此次在马乐案中亮相的深交所的“大数据”监测系统,更是引起了广泛关注。深交所有几十人的监控室,设置了200多个指标用于监测估计,一旦出现股价偏离大盘走势,深交所利用大数据查探异动背后是哪些人或机构在参与。,金融大数据,阿里“水文模型”是按小微企业类目、级别等分别统计一个阿里系商户的相关“水文数据”库。如过往每到某个时点,该店铺销售会进入旺季,销售额就会增长,同时每在这个时段,该客户对外投放的额度就会上升,结合这些水文数据,系统可以判断出该店铺的融资需求;结合该店铺以往资金支用数据及同类店铺资金支用数据,可以判断出该店铺的资

    注意事项

    本文(大数据前沿技术与应用场景_V1.20180409(37页).ppt)为本站会员(人***)主动上传,安全人之家仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知安全人之家(点击联系客服),我们立即给予删除!




    VIP会员
    加入vip,免费下载文档!
    微信客服
    服务号
    意见反馈
    点击发送邮件给我们
    返回顶部