英特尔何京翔:为云计算大数据重塑数据中心

第六届中国云计算大会于2014年5月20-23日在北京国家会议中心拉开帷幕。本次大会立足实践,以国际化的视野,帮助与会者了解全球云计算技术的发展趋势;从应用出发,探讨交通、医疗、教育、金融、制造、数字娱乐等行业领域的实践经验;并通过技术专场、产品发布和培训课程等方式,深度剖析云计算大数据的核心技术。

在第六届中国云计算大会全体会议下午的议程中,英特尔(26.29, 0.14, 0.53%)亚太研发有限公司总经理、软件与服务事业部中国区总经理何京翔带来演讲“为云计算和大数据重塑数据中心”。回顾数据中心的演变过程,从以计算机为中心,专注于通过自动化提高生产率,到以网络为中心,专注于通过连接降低成本,发展到目前已经以人为中心,专注于通过云和相关设备提供快速服务。何京翔认为数据中心已迎来转折点,英特尔提出SDI的概念,几分钟即可提供全新服务。大数据方面,英特尔与Cloudera强强联手,力争为Hadoop提供最佳硬件平台。

以下为现场实录:

何京翔:各位业界的朋友们,各位专家、各位领导,大家下午好!非常高兴又回到了中国云计算大会,这是我第三次来,一共六届,我参加了三届。我觉得每次来都有新的体会,特别是今天,我们能够跟百度(167.63, 4.10, 2.51%)、阿里和腾讯的朋友在一个舞台上共同来为大家讲述大数据、云计算的未来,我觉得本身就是一个荣誉,因为我们在中国有百度、腾讯、阿里这样的公司,真正体会到我们在这一轮的云计算、大数据的技术创新之中,中国真正站在了世界的前列。

讲到大数据、云计算,来到云计算大会,可能有人要问,作为业界的领头羊,英特尔在数据中心方面有这么大的市场份额,那么我们在云计算和大数据方面有什么样的举措呢?下面30分钟我想就这个问题跟大家来阐述一下在云计算和大数据的时代,特别是刚才梅院士也讲了,在软件定义时代,英特尔作为数据中心这样一个领头企业,我们在软件定义这个基础架构,我们在大数据方面有些什么样的举措。

首先,我们的创新都是基于市场,基于实际的市场应用和对未来的展望。我们在过去十几年通过互联网,特别是近几年通过移动互联,我们看到比如说像智能城市这样的应用在中国是风起云涌,很多省都在部署智能城市。移动互联也是一样,在座的很多人都是移动互联的消费者,我们通过自己的手机、移动设备、笔记本电脑,甚至有些穿戴设备都在不停地产生着数据,我们也在消费很多数据产生的服务。所以说,这些新的数据和通过数据分析产生的服务都是怎么产生的呢?都是由后台数据中心产生的,这就对数据中心提出了更高的要求。这是一方面。

另一方面,现在我们都讲物联网,它超出了互联网和移动互联,人人和人机交互的范围,这是机器与机器交互,无论规模和数量上都远远大于互联网和移动互联。未来几年里头,有将近500亿的设备会通过网络连起来,互相交互数据。产生的数据是350万亿,这是一个海量的数据,也就是说通过移动互联网加上互联网、物联网产生了海量的数据,海量的数据呼唤着海量的数据处理,海量的数据处理要求新的数据中心的架构。

英特尔亚太研发有限公司总经理 何京翔

大家在这个行业里都做了很多年了,我自己在IT行业做了30年,我们都知道,IT行业是一个不断更新的行业,我们这30年里头一直在不断的更新,不断的否定过去,创造新的未来。我们可以回顾一下我们数据中心演进的过程,最早的时候瞄准计算数据中心,目标是提高我们的计算能力,后来发展到以网络为中心,目标是为了提高我们的效率。但随着移动互联,特别是刚才讲的,我们是嵌入式的计算环境之中,计算无所不在,计算是围绕着人的,以前我们最早的时候,我们要把自己的数据到专门的机房上机,人要围着计算机转,现在是计算机围着人转,最后新的模式就是要以人为中心,以人为本的计算模式,这是我们现在所面临的。

在计算中心方面,我们英特尔过去15年里头走过了几个大的转折点,大家可以看到,从这个图的最上面,在2000年左右的时候,我们当时看到了数据中心的快速增长,看到了大家对这些数据中心快速增长过程中对通用服务器的要求,同时我们看到了软件,特别是开源软件对服务器和数据中心应用的一些新的趋势,我们大量投资在开源软件、开源操作系统上。同时由于我们的努力,可以看到我们基于X86架构的服务器,现在已经占据世界所有服务器市场份额的90%以上,而且大规模的软件应用是基于开源的,这是我们通过软件投资来带动硬件市场转变的一个案例。

当然,在2005年的时候,大家知道,虚拟化是现在云计算的基础,虚拟化发生的时候,我们又一次选择了这个机会,然后在这方面做了很多的软件投入,使得我们到去年,在数据中心里面采用虚拟化技术的份额达到60%左右,这又是一个转折点。

我们现在看到的是什么呢?云计算和大数据。云计算我们2010年的时候就开始,可以看到有很多的关于IaaS、关于PaaS和SaaS这方面的投资和应用,我们可以看到这个在不断的增长。但是,现在云计算数据中心的要求是不是够了呢?是不是所有的数据中心都能够满足像我们百度一样,能达到90%的份额呢?其实还不是,我一会儿会讲到我们面临的挑战。

对大数据更是这样,我们现在还是大数据初始阶段,就是说是在婴儿时期,我们还有很多技术方面,关于怎么样能够提供更优秀的最好的大数据方面,我们还有很多技术没有解决,所以这是我们今天怎么看大数据和数据中心的要求。

创新是需要勇气的,是需要面对现实的,来看一下我们今天所处的是什么样的状况。我这里举的例子当然不是百度、腾讯、阿里巴巴(滚动资讯)这样先进的网络计算公司,是一些标准的传统企业的数据中心所处的状况。比如说现在一个传统企业的数据中心,它的网络是什么样的状况呢?大概需要两三周的时间来实现一个网络的更新。然后我们现在的存储很多都是静态的,但是,我们数据的增长量是非常大的,往往会遇到我们存储的设备同数据增长之间不匹配,我们的计算大多数服务器使用率还在50%以下,当做到50%,祝贺你们,真的不容易,大部分还在50%以下。所以说,我们现有数据中心的架构和现有数据中心的现状是不能够满足于我们现在以人为本的大规模的数据计算和服务的要求,是不够动态、是不能够满足我们现在这样一个数据海量增长以及不同计算模式和应用层出不穷发生的这样一个现实的。

回到我刚才说的,知道差距在哪,就要针对差距做一些根本性的变革。这就是我们英特尔和业界其他同行一块提出来的,关于软件定义的基础架构这样一个理念。它的理念是什么呢?就是说我们怎么样通过我们的技术手段,通过我们的软硬结合的这样一个优势,把我们数据中心过去从一个设计到推广数据中心的实施,过去是要几个星期甚至几个月才能完成的工作,我们把它变成几个小时、几分钟来完成这个工作,这就是刚才梅教授讲的软件定义的一个钥匙。

所以,我们这个软件定义有几个重要的特征,也就是说数据中心今天我们有很多是手工的过程,把它自动化,有些设计是静态的,把它动态化,一些设备和服务以前是独享的,把它变成共享,也就是变成资源池。所以,这三方面是我们SDI很重要的一个主旨。

具体怎么做?当然这个概念,大家觉得我们是做云计算的,这是我们云计算要做的事情。但是具体怎么做,这里面英特尔有很多功课可以做,有很多东西可以跟大家分享。就像刚才梅教授讲的,有些东西,比如说硬件的颗粒物怎么凑API,怎么使得这个硬件设备用软件定义来管理。

比如说一个简单的例子,服务器基础设施转变,这就是我们SDI的基础,通过服务器基础设施转变,能够降低利用率。怎么能够把我们在服务方面的工作应用到网络和存储中去,使得我们有SDN和SDS,这是我们下面要做的事情。存储方面,我们现在很多数据中心的存储基本上是一个存储服务器加上一个接口,在未来我们可以提供软件可管理的,能够实现自动的冷数据、热数据的分层,能够减少数据的重复量,同时,再下一步提供这样的云接口,使得存储是基于你的管理模式自动的进行调整。所以说,通过SDI,我们可以从计算、存储和网络三个方面都实现软件定义的提供一定的颗粒化管理的接口,这样实现对英特尔硬件最好的网络、存储与计算管理。

当然,刚才我们讲过,这是一个业界的共识,包括VMware(96.51, 0.07, 0.07%),包括HP、包括IBM(185.94, 0.26, 0.14%)、华为,这也是我们业界一起,众人拾柴火焰高,往这个方向去努力的基础。也就是刚才梅院士讲的软件定义的基础架构,软件定义的数据中心,软件定义的服务即将变成我们云计算和大数据计算数据中心的基础。

谈到了大数据,在刚才我们做软件定义基础架构的基础上,我们对大数据有了自己非常独特的研究。在这里跟大家汇报一下,英特尔大数据的创新很多是基于中国的,我们主要的研发团队是在上海,所以这也是我们非常自豪的跟大家分享了一点。这方面我们在中国其实是有很多领先和先发的优势,比如说在运行效率的优化程度,我们已经和中国的国康、海康合作,提供智能城市、智能交通服务。在消费方面,我们和阿里支付宝有很多方面的合作,大家在用淘宝的时候,很多后台的服务优化其实就是英特尔中国团队跟阿里合作,来帮助阿里大数据在英特尔后台上跑得更快。在安全上,我们提供了大数据服务的引擎在里面,然后提供我们进一步的安全管理。

正因为我们在大数据方面,特别是在中国的应用上有这么多的斩获,所以,大数据变成了英特尔数据中心部门三个重要的方面,一个是高性能计算,第二是云计算,第三是大数据,所以大数据是英特尔数据中心部门的一个主要的核心部门。基于它非常重要,所以,大概3月份的时候,英特尔做了一个非常重要的战略投资,把Cloudera 18%的股份买过来,我们投资7.4亿,当时我们做这个战略投资时,有很多媒体的报道,5月初我们专门在中国上海和北京做了两次英特尔和Cloudera合作的媒体发布会,这个合作其实对中国市场来说是非常重要的。第一,英特尔有这么大的投资,正是意味着我们对大数据非常重视,当时有些媒体在3月底的时候说,是不是意味着英特尔不做Hadoop,就要退出大数据了?其实不是这样的,哪有投资7亿多美金,然后退出这个市场的道理。我们做的恰恰相反,要加大在这方面进行努力,通过培育更强健的生态系统和业界领先伙伴把这方面做得更大更强。

对于我们第二点要提到的,我们原来有英特尔的Hadoop发行版,现在是不是消失了呢?其实不是,因为现在的Hadoop发行版将融入到我们Cloudera发行版里面去,这意味着什么呢?这意味着我们现有的用户将得到更好的支持,未来的用户将得到增强版的CDS的支持,使得他更好的融入我们的发行版里面去。

第三,英特尔做这么大的投资目的是为了让我们未来的大数据平台在英特尔平台上跑得最好,我们为大数据的应用提供最好的平台,而不是要使得大数据在这个里面变成一个更好的部分,我们要变成更大的部分。

基于前面这三点,我们利用在安全和平台优化上的优势把它进入到Cloudera里面去,真正可以体会到1+1大于2的效果。对Cloudera来讲,大家知道它现在是全球第一的发行版,它的创始人也是Hadoop的创始人,所以说在业界的影响非常火,他有1000多个数据合作伙伴,通过我们的合作,我们把Cloudera带到中国来,使得我们形成强强联手,聚焦中国,领航大数据的局面。

刚才我讲到了,英特尔有的不光是Hadoop这一个方面,我们的长处是在整个平台构建一个大数据平台。首先从系统优化上讲,我们有硬件的安全加密技术,有压缩技术。第二点,我们的存储技术上也是有我们的优势,我们可以比常规的存储要快20—30倍。再有,我们现在跟中国业界的伙伴合作,我们在机架集成上有自己的独到之处,可以把整个系统优化的机架变成一个大数据处理平台,提供一个优化平台,从而使得我们对大数据处理有一个质的飞跃。

刚才讲到大数据平台,大家可以看到大数据平台不是一个公司就能做完的,比如说下面有存储、网络和分析,中间有一个大数据平台,它相当于大数据的操作系统,在上面有分析工具和行业应用,这些东西全加起来才是一个真正的大数据解决方案平台。大家可以想象,这不是任何一家公司可以做完的,是需要行业界的合作,是需要众人拾柴火焰高的努力来完成的。所以,我们现在要做的投资,跟Cloudera的合作,以及跟其他厂商的合作,就是要共同构建这样一个大数据平台,使得我们在这个平台上,大家都能分一杯羹,这也是英特尔比较传统的一个模式,就是英特尔本身不是一个一家通吃的公司,我们希望构建这么一个平台,大家把饼做大,使得我们都能够获益。

 

原文出自【比特网】