周海汉
/文
http://blog.csdn.net/ablo_zhou
ablozhou # gmail.com
2010.3.17
cassandra是所谓高可用性第二代分布式数据库。facebook 2008年提交到apache的开源混合非关系数据库。具有amaza 专有分布式key-value数据库dynamo和google bigtable基于列族的数据模型的特点。对于云集算,sns等需求超大数据库,而又随时可能需要更改列等需求,cassandra很适合。我的理解,有了cassandra,就不必费心做数据库集群了,cassandra原生支持分布式节点,一个节点失败了会有其他节点替代。
这么强大的数据库,难怪一推出就受到很大的重视,最近又传出消息,继twitter之后,digg也弃mysql转向了cassandra。
1.直接下载二进制,ubuntu不能运行
到apache官网下载http://cassandra.apache.org/
目前最新版本0.6beta2.
二进制 http://www.apache.org/dyn/closer.cgi?path=/incubator/cassandra/0.6.0/apache-cassandra-0.6.0-beta2-bin.tar.gz
源码:http://www.apache.org/dyn/closer.cgi?path=/incubator/cassandra/0.6.0/apache-cassandra-0.6.0-beta2-src.tar.gz
但我在ubuntu中直接下载二进制执行cassandra出错。
当然,此前必须根据conf/storage-conf.xml和log4j.properties建立相关目录。
zhouhh@zhh64:~$ sudo mkdir /var/lib/cassandra/
zhouhh@zhh64:~$ sudo mkdir /var/lib/cassandra/{commitlog,data,callout,staging}
执行出错:
zhouhh@zhh64:~/cassandra/apache-cassandra-0.6.0-beta2/bin$ ./cassandra -f
./cassandra: 162: -ea: not found
通过apt-cache 搜索不到,因为没有相关源。
zhouhh@zhh64:~$ sudo apt-cache search cassandra
无返回
2.通过apt-get下载
设置源:
root@zhh64:~#sodo vi /etc/apt/sources.list
添加apache官方deb源:
deb http://www.apache.org/dist/cassandra/debian unstable main
deb-src http://www.apache.org/dist/cassandra/debian unstable main
保存,更新
zhouhh@zhh64:~$ sudo apt-get update
此时会提示错误:
W: GPG签名验证错误: http://www.apache.org unstable Release: 由于没有公钥,下列签名无法进行验证: NO_PUBKEY F758CE318D77295D
GPG error: http://www.apache.org unstable Release: The following signatures couldn't be verified because the public key is not available: NO_PUBKEY F758CE318D77295D
没关系,设置public keyserver,增加PUBLIC_KEY:
zhouhh@zhh64:~$ gpg --keyserver wwwkeys.eu.pgp.net --recv-keys F758CE318D77295D
gpg: 下载密钥‘8D77295D’,从 hkp 服务器 wwwkeys.eu.pgp.net
gpg: 密钥 8D77295D:公钥“Eric Evans <eevans@sym-link.com>”已导入
gpg: 没有找到任何绝对信任的密钥
gpg: 合计被处理的数量:1
gpg: 已导入:1 (RSA: 1)
zhouhh@zhh64:~$ gpg --export --armor F758CE318D77295D | sudo apt-key add -
OK
zhouhh@zhh64:~$ sudo apt-get update
不再报错。
3.安装
zhouhh@zhh64:~$ apt-cache search cassandra
cassandra - distributed storage system for structured data
zhouhh@zhh64:~$ sudo apt-get install cassandra
正在读取软件包列表... 完成
正在分析软件包的依赖关系树
正在读取状态信息... 完成
将会安装下列额外的软件包:
ca-certificates-java icedtea-6-jre-cacao java-common jsvc
libcommons-daemon-java libjline-java openjdk-6-jre-headless
openjdk-6-jre-lib rhino tzdata-java
建议安装的软件包:
equivs java-virtual-machine libjline-java-doc sun-java6-fonts
ttf-kochi-gothic ttf-sazanami-gothic ttf-kochi-mincho ttf-sazanami-mincho
ttf-telugu-fonts ttf-oriya-fonts ttf-kannada-fonts ttf-bengali-fonts
rhino-doc
下列【新】软件包将被安装:
ca-certificates-java cassandra icedtea-6-jre-cacao java-common jsvc
libcommons-daemon-java libjline-java openjdk-6-jre-headless
openjdk-6-jre-lib rhino tzdata-java
共升级了 0 个软件包,新安装了 11 个软件包,要卸载 0 个软件包,有 7 个软件未被升级。
需要下载 36.0MB 的软件包。
解压缩后会消耗掉 94.4MB 的额外空间。
您希望继续执行吗?[Y/n]
执行完即安装成功。
再去执行原来的二进制包,提示变了:
zhouhh@zhh64:~/cassandra/apache-cassandra-0.6.0-beta2/bin$ ./cassandra -f
错误: 代理抛出异常 : java.rmi.server.ExportException: Port already in use: 8080; nested exception is:
java.net.BindException: Address already in use
说明,新安装的cassandra已经起作用了。
用ps -ef 可以看到java 的jsvc启动的cassandra进程。
4.参考
http://wiki.apache.org/cassandra/DebianPackaging
http://wiki.woodpecker.org.cn/moin/ApacheCassandra
http://wiki.apache.org/cassandra/GettingStarted
分享到:
相关推荐
cassandra 分布式数据库
了解一个软件的配置项的意义是使用这个软件的前提,这里介绍 Cassandra 的配置文件(storage-config.xml)中各个配置项的意义,这其中包含有很多配置参数,我们可以对其进行调整以达到理想的性能。
为您提供ApacheCassandra 分布式数据库下载,Apache Cassandra是一个混合型的非关系的数据库,开源分布式Key-Value存储系统,主要特性有分布式、基于column的结构化、高伸展性!软件介绍 当您需要可扩展性和高可用...
Cassandra是一个开源的分布式数据库,结合了Dynamo的Key/Value与Bigtable的面向列的特点。
Cassandra是一个开源的分布式数据库,结合了Dynamo的Key/Value与Bigtable的面向列的特点,本文档对Cassandra源代码作了详细的分析,可以了解整个集群的运作细节。
Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发,用于储存收件箱等简单格式数据,集GoogleBigTable的数据模型与Amazon Dynamo的完全分布式的架构于一身Facebook于2008将 Cassandra 开源,此后,...
1.CAP定理理与Cassandra 1.1 Cassandra优势 2.Cassandra ⼀一致性实现 2.1 CAS 2.2 Quorum读写 2.3 不不⼀一致产⽣生原因 2.4 Hinted handoff 2.5 Read repair 2.6 Manual repair 3.Cassandra应⽤用场景 ...
这是一个结合cassandra数据库安装文档,里面有在linux 和window xp下的安装步骤。cassandra是一个分布式数据库,现于大家共享。
CASSANDRA分布式模型与源代码分析文茂V0.7 - CASSANDRA-SHAWN.doc
使用键空间、数据库表和分区键值访问数据,而无需编写 CQL 查询。 或者,在Cassandra:trade_mark:数据库上执行CQL查询,然后将查询结果导入MATLAB。
集群很容易扩展以支持更大的数据集,Titan有一个很好的插件式性能,这个性能让它搭建在一些成熟的数据库技术上像 Apache Cassandra、Apache HBase、 Oracle BerkeleyDB。插件式索引架构可以整合 ElasticSearch ...
当与分布式数据库/存储(例如Cassandra)一起部署时,它不仅支持高度一致的ACID事务,而且可以线性扩展并实现高可用性。安装该库在上可用。 您可以使用构建工具(例如Gradle)将其安装在应用程序中。 例如,在...
Cassandra分布式数据库架构与应用
JAVA操作cassandra数据库,包括java代码及操作cassandra数据库总结文档。
分布式测试 集群测试。 先决条件 应安装 ccm 的最新副本以启动和停止 Cassandra。 测试是使用鼻子测试运行的。 这些测试需要 datastax python 驱动程序。 一些测试仍然需要已弃用的 python CQL over thrift 驱动程序...
CCUG 中国Cassandra数据库用户组(China Cassandra User Group) ...是一个分布式的图数据库,使用Cassandra作为后端存储 [Cassandra-lucene-index] () 是一个Cassandra插件,支持Full text、Geospatial search