内存是新的硬盘

High Scalability有篇基于内存构建云的展望。顺手做一下笔记:

  • Google的一个查询能够在200ms之内完成,其性能主要来源就是索引信息完全在内存里。数以千记的服务器处理每一个查询,以使搜索结果能立刻返回。
  • Linkedin和digg都把自己的社会关系网络给塞到内存里了。
  • Facebook使用了800个memcached,存储了25T的数据,并且保持了99%的cache命中率。
  • 在基于内存的结构中,内存将是一套存储系统。与基于缓存的结构不同之处是,内存中的数据即是最终数据。
  • 缓存系统是以最小化磁盘读取数据的瓶颈为目的,而内存系统则可以定址整个应用的栈。 数据存储在内存里比之传统方式将获得更高的可用性。
  • 内存=高带宽和低传输时间。
  • 内存的带宽是5GB/s,硬盘是100MB/s。内存比硬盘快数百倍。
  • 硬盘的读传输时间大约在几秒的范围之内,内存则在5纳秒之内。内存比硬盘快了2000倍。
  • 内存是新的硬盘
  • 通过网络在内存中提交一个事务要比写在硬盘上快。同样的读内存也要比读硬盘快。
  • 所以思想就是要跳过硬盘。
  • 硬盘是新内存,内存是新缓存。50个硬盘的集群可以达到与内存相同的带宽。但是传输时间上的问题就要靠组织数据结构和优化算法实现了。

记的比较乱,大概留个映像吧。要让数据靠CPU足够近。


Last modified on 2009-11-27