新版Apache Cassandra将突破传统存储瓶颈存储与灾备
日前,Apache基金会下属的一个NoSQL分布式数据库Cassandra宣布了一个重要的更新版本。全新的1.2版本主要针对最近一段时期企业数据中心硬件架构的变化加入了新的虚拟磁盘故障预警机制和配置策略,以便适应集群化存储和大数据。
Apache Cassandra是一套开源分布式Key-Value存储系统,最初由Facebook开发,后转变成了Apache基金会的一个开源项目。Cassandra本身是一个面向社交网络云计算方面的数据库,以Amazon完全分布式的Dynamo数据库为基础,结合了Google BigTable基于列族的数据模型以及P2P去中心化存储等工具的特点。而新的Cassandra 1.2版本则主要对PB级别数据的集群存储做出了优化和改进。
Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对Cassandra的一个写操作,会被复制到其它节点上去,对Cassandra的读操作,也会被路由到某个节点上面去读取。对于一个Cassandra群集来说,扩展性能是比较简单的事情,只需在群集里面添加节点就可以了。
Apache Cassandra项目副主席Jonathan Ellis表示:1.2版本改善了对密集群(dense clusters)的支持,简化了应用程序建模,改善了数据单元存储/设计/表征,系统可以毫不费力地扩展到PB级别数据。
该版本的新特性还包括了跨虚拟节点集群、节点间的通信、原子批处理、请求跟踪等。
此外,该版本中还包含了第3版的Cassandra查询语言CQL3,简化了应用建模、允许更强大的映射,并通过更加自然的表征来减少设计上的限制。
由于大数据等应用的发展,存储已经越来越成为其应用的重要制约因素。而为了应对这一现象,存储集群成为了目前比较主流的选择,而新的Cassandra 1.2版则应对了这一发展趋势。