本文是一篇数据论文范文,关于数据相关本科毕业论文范文,关于云到底有多大?相关函授毕业论文范文。适合数据及规模及文件方面的的大学硕士和本科毕业论文以及数据相关开题报告范文和职称论文写作参考文献资料下载。
摘 要:计算机的云计算已经成为现今互联网发展的主题,其延伸和发展出的云存储也当仁不让地成为了主流的数据存储和管理方式.那么,这些云到底有多大呢?文章通过几个大公司的数据对其数据规模和带宽进行了估计.
关 键 词 :云计算; 云存储; 数据规模; 带宽
计算机的云计算已经舍我其谁地成为现今互联网发展的主题,其延伸和发展出的云存储也当仁不让地成为了主流的数据存储和管理方式.云存储系统正逐步成为网站和网络服务方用于存放和管理自己数据信息的主要选择.云那头究竟风景如何,让我们来探个究竟.
根据科技网站ExtremeTech的统计,在整个互联网的下载流量中,有40%是访问YouTube这样的视频网站产生的;网站则占了另一大山头,占据整体流量的30%;剩下的30%由网络硬盘数据下载、访问网址、电子邮件等日常网络服务产生.当电脑前的人们从互联网上获取信息时,大概没有人会去关注信息究竟来自何处.如果大家顺藤摸瓜,便可以发现这些信息中的绝大部分都来源于互联网的云端.
如今提供云存储服务的服务商不仅有亚马逊(旗下Amazon Web Services)、微软(旗下Microsoft Azure)和谷歌(旗下Google Drive)这样的网络巨头,还有成百上千的小公司机构.它们中或拥有一个完整的数据中心,或只有几个机箱的存储设备,规模参差不齐.从这些大大小小的公司身上,我们大可窥探整个云储存产业的火爆程度.
云计算因其出众的能力备受青睐,它可以最快的效率为网络中的任何一方提供相关服务.谷歌麾下的一个单单为YouTube服务的“云团”就可以存储管理几个PB(1PB等于1024TB)的数据.云计算可以有几TB的RAM与几千核的CPU,远非传统计算机可比.而云计算延伸发展出的云存储又究竟有着怎样的魅力,以致于引得谷歌、微软和Dropbox这样的巨头竞相折腰?那就让我们先从数据入手吧.
数据规模
通常,谷歌、Facebook、亚马逊和微软这样的大公司都很少对外发布自己的详细数据.不过,如果用心去多方核查,还是可以得到一些大概的数值.
Facebook:在Facebook的IPO档案中,他们提到自己存储着约为100 PB的图片及视频信息.如果考虑了Facebook还要对用户状态这些信息进行网络备份,我们猜测,100 PB绝对不是他们的存储上限.这里,把这个数值估为300 PB应该不为过.
微软:微软近日承认自己的Hotmail服务器内存有超过100 PB的信息,而有着1700万用户的SkyDrive也存有10 PB的信息.合理预测整个微软的存储规模,应该不在Facebook之下,我们也把它的存储上限估为300 PB.
Megaupload:和上面两个网络巨头相比,Megaupload自然是小巫见大巫,不过它在业内确也有着一席之地,算是25 PB吧.
亚马逊:亚马逊旗下有Simple Storage Service这一网络储存服务(简称S3).亚马逊从来没有向公众透露过S3究竟存有多大规模的数据量,不过,今年四月,他们却对外宣布S3中存有9050 亿份文件.假设平均每份文件的大小为100KB,则S3的存储量在90 PB上下;假设平均每份文件为1 MB,那么S3的存储规模将达到900 PB.果真如此的话,它将成为唯一一个储存规模接近1EB(1 EB等于1 024 PB)的服务商.
Dropbox:去年还只有2500万用户的Dropbox当时对外宣布,自己存储着逾10 PB的数据.如今Dropbox的用户数已经上升到了一亿,那么,他们的存储规模应该在40 PB上下.
储存这些数据究竟多耗地方呢?我们得把这些虚拟数据的大小具体化.一台普通电脑的硬盘平均存储空间为500 GB或者1 TB,也就是说微软和Facebook最少也得有100 000个硬盘用于存储信息.普遍情况下,一个4U机箱内可以塞进48个硬盘.考虑到还要塞一些其他的连接设备,那么,一个40U的机柜大概可以存储400个硬盘.一个40U的机柜占地约为1平方米,也就是说,要存储100 000个硬盘还是很占地方的.不过对于谷 歌、亚马逊、Facebook或是微软这样有着30 000多平方米大楼的地主公司来说,找个地方放机柜还是不成问题的.事实上, CPU、服务器和网关比硬盘要占地得多.
带宽
关于带宽,我们能获得的数据就更加有限了.有数据显示,去年全球内每五分钟就有100万份数据被下载.今年的网络用户比去年多了3倍,那么,今年每分钟的下载数量会达到80万的水平.亚马逊的S3作为全球网络存储之首,对外宣布他们的服务器每秒钟要处理的下载请求达到65万份.
Dropbox:假设Dropbox上每份文件(有图片文件、视频文件和文档)的平均大小为500 KB,那么,根据Dropbox公布的数据,可以推测他们服务器每分钟的流入数据流(用户上传数据)为0.4TB,也就是每秒6.7 GB(交换带宽54 Gb/s).对于Dropbox的流出数据流(用户从 Dropbox服务器上下载文件),我们没有详细信息,不过可以估计,其带宽大概在10~20 Gb/s之间.
亚马逊S3:亚马逊的S3主要是用于网站存储数据,所以,其文件以文字图片、网站样式文件和网页视频为主.这些文件的平均大小会小于Dropbox, 假设为100 KB.根据亚马逊公布的信息,他们每秒要接到650 000个数据请求,那么,也就是每秒61 GB(交换带宽488 Gb/s),这无疑真是个庞然大物.
Facebook及微软:这两者的数据存储规模都在100 ~300PB,我们估计,两者的带宽应当位于Dropbox和亚马逊S3之间,暂且定为200 Gb/s.