摘要: 亚马逊网络服务AWS已经向所有用户开放了其基于云的数据仓库Redshift服务,该服务可以作为本地部署的的一个更加省钱的选择。 |
亚马逊网络服务AWS已经向所有用户开放了其基于云的数据仓库Redshift服务,该服务可以作为本地部署的的一个更加省钱的选择。
亚马逊Redshift起初是在AWS re:发明大会上作为有限预览版露面,现在已经在美国东部(北维吉尼亚)数据中心可用,并将在后面几个月推至其他所有地区。
正如其他的基于云的产品,亚马逊希望以其速度和成本优势来吸引起来到AWS上建立数据仓库。
传统的数据仓库解决方案价格昂贵而且管理复杂,亚马逊网络服务的Andy Jassy称,而Redshift的成本只需传统的1/10,并且可以自动化部署和管理。
使用AWS管理控制台或者亚马逊Redshift API后,在默认情况下,用户可以提供一个单独的2TB数据仓库或者16个作为簇的2TB节点,或16TB的节点。
这些节点被称为高存储特大号(XL)或存储8特大号(8XL)。除了2TB或16TB的存储空间,他们还拥有15GB或120GB的RAM。
按需计价的标准为:XL节点每小时0.85美元起,8XL节点每小时6.8美元起。保留实例定价的实际价格降低到每小时0.228美元,或是每TB每年1000美元以下。
良好的安全性和可靠性是任何数据仓库的关键因素。所有写入Redshift簇的数据,都会被自动复制到簇内的其他节点上,并且连续不断的备份到亚马逊简单存储服务S3上。
在数据保护上,Redshift采用了在数据传输中使用SSL协议,以及主数据和备份数据的硬件都使用了AES-256算法加密。使用虚拟私有云的,可以使用加密的VPN隧道来将Redshift连接到企业已有的数据中心。
许多厂商一直都在使用基于SQL的Redshift来测试他们的大数据和分析产品。用户可以在亚马逊市场购买Jaspersoft的报告和AWS分析。该服务也可以使用Business Object和Cognos等商业智能工具来进行集成。
将数据上传到Redshift的方式有多种,有大量数据的公司可以使用AWS Direct Connect来设置一个速度为1G bps或10G bps的私有网络来连接他们的数据中心和亚马逊云。他们也可以使用AWS导入/导出来将数据发送到便携存储设备上。
Redshift也可使用AWS Data Pipeline来从S3和DynamoBD等服务直接导入数据或加载数据。
责任编辑:GOCN