内存是新的硬盘
High Scalability有篇基于内存构建云的展望。顺手做一下笔记:
- Google的一个查询能够在200ms之内完成,其性能主要来源就是索引信息完全在内存里。数以千记的服务器处理每一个查询,以使搜索结果能立刻返回。
- Linkedin和digg都把自己的社会关系网络给塞到内存里了。
- Facebook使用了800个memcached,存储了25T的数据,并且保持了99%的cache命中率。
- 在基于内存的结构中,内存将是一套存储系统。与基于缓存的结构不同之处是,内存中的数据即是最终数据。
- 缓存系统是以最小化磁盘读取数据的瓶颈为目的,而内存系统则可以定址整个应用的栈。 数据存储在内存里比之传统方式将获得更高的可用性。
- 内存=高带宽和低传输时间。
- 内存的带宽是5GB/s,硬盘是100MB/s。内存比硬盘快数百倍。
- 硬盘的读传输时间大约在几秒的范围之内,内存则在5纳秒之内。内存比硬盘快了2000倍。
- 内存是新的硬盘。
- 通过网络在内存中提交一个事务要比写在硬盘上快。同样的读内存也要比读硬盘快。
- 所以思想就是要跳过硬盘。
- 硬盘是新内存,内存是新缓存。50个硬盘的集群可以达到与内存相同的带宽。但是传输时间上的问题就要靠组织数据结构和优化算法实现了。
记的比较乱,大概留个映像吧。要让数据靠CPU足够近。
Last modified on 2009-11-27