数据分析与知识发现
    主页 > 综合新闻 >

海澜之家打造数据分析系统,为何选择Hitachi Va

《世界互联网发展报告2018》和《中国互联网发展报告2018》蓝皮书指出2017年,全球数字经济总量达12.9万亿美元。2018年,中国数字经济规模突破31万亿元人民币。从国家层面来看,数字经济与实体经济融合是带动经济、社会发展的强大动力。从企业角度来讲,数字与业务结合能够通过发现和利用数据蕴藏的商业价值进一步提升企业竞争力和促进业务增长。

今天各个行业在发展中面临着各种挑战,而很多企业在不断的发展和突破中认识到,数字化转型是提升企业竞争力的重要手段。就像服装行业,传统的线下门店零售如果不拥抱互联网,其销售和利润将会面临很大压力。同时随着实体零售业规模不断扩大,还面临着成本上升、竞争加剧、经营困难、创新转型难度大等问题。

移动互联时代,挖掘数据价值成为企业需求

这其中每个企业利用数字化转型的广度和深度不同,需要采用的数字化转型工具也不同。就像“男人的衣柜”海澜之家一样,海澜之家数字化转型比较早,早在2012年,Hitachi Vantara就基于Virtual Storage Platform(VSP)为海澜之家其核心存储平台以及SAP建设。到现在海澜之家已经拥有了清晰完整的基础数据层,以及实现了采集完整的数据能力,同时充分利用对象存储Hitachi Content Platform (HCP) 的存储扩展性和数据管理能力,Hadoop 的计算存诸能力和分析型数据库的并发查询能力; 数据分层遵循高效、稳定、易用原则,三层数据架构可满足未来数据应用需求。

在存储和数据应用方面需求满足之后,海澜之家面临的问题是希望通过数字化转型,运用数据分析、物联网、人工智能等技术,对商品的生产、流通与销售过程进行升级改造,实现线上服务、线下体验以及现代物流进行深度融合的零售新模式。

目前海澜之家直面的一个问题是数据分析建立在传统架构中,无法对互联网数据进行数据分析;无法获取网页数据以进行市场分析、价格分析和用户使用体验分析。

“海澜集团的数据分析或者它传统的一些数据平台最早是用传统的ERP。传统ERP会有性能相关的问题,当它体量比较大的时候,它就不能够适应互联网时代的速度反应。后来它就逐渐地采用了SAP HANA。SAP HANA是典型的内存数据库,所以它运行速度比较快,能够应对几千个门店快速请求的反应,完成企业ERP系统的管理。但是到海澜之家面临数据分析需求之后,他们发现SAP本身虽然带来性能提升,SAP HANA管理的自身的数据也没有问题,但对外部数据的获取、注入和处理是有困难的。” Hitachi Vantara中国区解决方案销售总监于希国在跟踪整个项目的过程中发现。

Pentaho助力海澜之家真正实现企业内外数据集成

海澜之家希望能够将线上的数据,包括一些评论的数据和自己企业内部的数据结合起来,做市场的分析、做定价的分析、做产品质量的跟踪,以及加强跟消费者之间的互动。这包括企业内部ERP的数据以及在SAP HANA的数据。

在了解海澜集团面临的挑战后,Hitachi Vantara 基于Pentaho工具为海澜集团搭建了一套端到端数据分析系统,从数据集成、数据组织、数据丰富、数据存储、数据分发到数据分析展现,为部门、公司、集团提供决策支持,让海澜集团更为精准地了解自己产品的销售和用户使用体验,同时掌握同类市场产品销售和用户使用体验,可以更好地制订市场销售战略和产品设计研发,从而提高企业收益。

“从2018年9月底开发环境和生产环境准备工作开始搭建Pentaho开始,通过对报表业务、数据调研等业务的理解和需求分析,通过Pentaho数据集成ETL流程和规划设计、CDH数据模型设计等系统设计再到开发测试,Pentaho报表开发、报表集成等系统开发测试,最后2018年11月底,就完成到生产上线部署试运营、生产优化线上运行,知识转移。” Hitachi Vantara大数据及物联网分析经理王善越。

数据整合和分析平台软件的Pentaho五大独特价值

Pentaho从诞生之初就注重了结合BI和大数据的融合。既可以对传统的BI做,也可以做大数据的工作,最终从数据抽取到数据湖的建立到数据挖掘分析,以及结合现在非常流行的AI、机器学习。具体来看Pentaho,于希国分享了Pentaho五大独特价值来助力包括像海澜之家等各个行业客户提供数据整合和分析。

第一,多种数据源的快速导入数据湖。不管是结构化的,还是非结构化的数据,都可以非常快速地导入数据湖。

第二,全程可视化开发。Pentaho做开发非常容易,不像原来一般传统的编程,像BI的软件都是通过编程、代码生成,然后编译,最后形成一个软件,封闭的系统。Pentaho是一个开源平台,有很大一部分代码是开源给客户。所以,全程可视化开发对于很多客户是非常有意义的。Pentaho还可以利用Hadoop技术、并行计算的技术,提升整体的计算性能。因为数据抽取之后,做数据分析的时候,计算性能很重要。“比如有的时候我们有一些客户原来要用20个小时,经过我们优化,可能不到1个小时就搞定了。所以这给客户带来很大的价值。”