从软件开发早期(1960 年代)开始,应对大型软件系统中的复杂性一直是一项令人生畏的任务。多年来为了应对软件系统的复杂性,软件工程师和架构师们做了许多尝试:David Parnas 的模块化和封装 (1972), Edsger W. Dijkstra (1974)的关注点分离以及 SOA(1988)。
2024年09月11日
从软件开发早期(1960 年代)开始,应对大型软件系统中的复杂性一直是一项令人生畏的任务。多年来为了应对软件系统的复杂性,软件工程师和架构师们做了许多尝试:David Parnas 的模块化和封装 (1972), Edsger W. Dijkstra (1974)的关注点分离以及 SOA(1988)。
2024年09月11日
Nodetool是一个查看集群信息的命令,在cassandra安装目录的bin目录中,可以查看集群统计信息、节点信息、数据环信息、增删节点、刷新Memtable数据到SSTable、合并SSTable等。
2024年09月11日
如果你来自RDBMS的世界,在Cassandra有效地开始建模实体之前,需要一些时间来适应。帮助我解决问题的经验法则是让您的查询定义您需要的实体。
最近,我将应用程序的持久层从Oracle迁移到Cassandra。虽然迁移一些主要实体相当简单,但它解决了一些用例,比如支持范围扫描,这给我们带来了一组独特的挑战。
2024年09月11日
CAP定理是分布式领域的一个基础定理,它指出了一个分布式系统必须在三个方面进行权衡取舍:一致性、可用性、分区容忍性。
下面从一个最简单的例子开始理解CAP理论。
对于一个单节点服务,因为只有一个节点,不存在分区,所以没有P,只有CA。所以这是一个CA系统。
首先看C,在CAP定义中, C的含义是任何时间、任何节点读取的数据,都是相同的,即保证了一致性。因为只有一个节点,所以C总是满足。
2024年09月11日
基于LSM-tree的键值存储系统是NewSQL/NoSQL产品中最常用的底层存储方案,对其进行研究具有重要意义与应用价值。论文针对 分布式键值系统首次提出了副本解耦的思想,在多副本容错机制下能够实现副本数据的高效管理,从而显著提升系统性能。并且论文提出的技术可以应用到Cassandra、TiKV、ScyllaDB等系统中。本次分享将和大家一起讨论基于副本解耦的分布式键值系统的设计实现方案,并探讨未来的推广应用。
2024年09月11日
内容来源:2017年6月11日,饿了么数据专家翟玉勇在“饿了么&七牛云联合论坛 大数据最新场景化应用实践”进行《cassandra在饿了么的应用》演讲分享。IT 大咖说作为独家视频合作方,经主办方和讲者审阅授权发布。
阅读字数:1759 | 4分钟阅读
1、饿了么大数据为什么选择cassandra
2024年09月11日
互联网时代各种数据存储方式层出不穷,有传统的关系性数据库如:MySQL、Oracle等,;有全文检索框架如:ElasticSearch、Solr;有NoSQL如:Cassandra、Redis
这些存储方式的特点:
2024年09月11日
在之前关于数据库一致性的博客中,我们详细讨论了应用程序在处理最终一致的NoSQL数据库时所面临的风险和挑战。我们也打破了最终一致的数据库比强一致的数据库表现更好的神话。在这篇博客中,我们将更深入地研究YugaByte数据库是如何在提供强一致性的同时优于Apache Cassandra这样的最终一致性数据库的。注意,YugaByte DB保留了与Cassandra Query Language (CQL) API的drop-in兼容性。
2024年09月11日
DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现各种异构数据源之间高效的数据同步功能。最近,阿里云cassandra团队为datax提供了cassandra读写插件,进一步丰富了datax支持的数据源,可以很方便实现cassandra之间以及cassandra与其他数据源之间的数据同步。本文简单介绍如何使用datax同步cassandra的数据,针对几种常见的场景给出配置文件示例,还提供了提升同步性能的建议和实测的性能数据。
2024年09月11日
?本文是左耳耗子推荐的Medium上的一篇关于MySQL的文章Some study on database storage internals,本人觉得文章十分好,就取得了作者的许可,自行进行了翻译,原文链接见文末。本文是一篇介绍性的文字,所以文中并没有对一些概念进行详细介绍,比如说Sorted Strings Table结构和Bloom filters算法等专业概念,感兴趣的小伙伴可以学习参考中给出的链接或持续关注本人后续文章。
?我一直以来都在不断的研究和探索数据库的内部存储原理。我认为这个话题是非常巨大且复杂的,我努力所学也只占其千万分之一。在这篇文章中,我将会讲解一些数据库存储的内部机制,数据库是如何进行优化操作来提供惊人速度及其优势和缺点。