内存是新的硬盘

High Scalability有篇基于内存构建云的展望。顺手做一下笔记: Google的一个查询能够在200ms之内完成,其性能主要来源就是索引信息完全在内存里。数以千记的服务器处理每一个查询,以使搜索结果能立刻返回。 Linkedin和digg都把自己的社会关系网络给塞到内存里了。 Facebook使用了800个memcached,存储了25T的数据,并且保持了99%的cache命中率。 在基于内存的结构中,内存将是一套存储系统。与基于缓存的结构不同之处是,内存中的数据即是最终数据。 缓存系统是以最小化磁盘读取数据的瓶颈为目的,而内存系统则可以定址整个应用的栈。 数据存储在内存里比之传统方式将获得更高的可用性。 内存=高带宽和低传输时间。 内存的带宽是5GB/s,硬盘是100MB/s。内存比硬盘快数百倍。 硬盘的读传输时间大约在几秒的范围之内,内存则在5纳秒之内。内存比硬盘快了2000倍。 内存是新的硬盘。 通过网络在内存中提交一个事务要比写在硬盘上快。同样的读内存也要比读硬盘快。 所以思想就是要跳过硬盘。 硬盘是新内存,内存是新缓存。50个硬盘的集群可以达到与内存相同的带宽。但是传输时间上的问题就要靠组织数据结构和优化算法实现了。 记的比较乱,大概留个映像吧。要让数据靠CPU足够近。 Update: 刚才看到了几幅图和这个题很近。

Wave和科技创新

周末参加了豆瓣举办的Python聚会,直播使用了Google的新产品—-Wave,发现Wave真的可以把会议室给解放出来。 刚刚接触到Wave的人,大多都有些失望,发现Wave和一个即时通信工具没有什么两样,只不过组的成员是不固定的。同样也没有带来想象中的信息爆炸。 然而在这次聚会直播中,我们发现了Wave的真正实力,与IM相比Wave多出了这样几个功能。 可以在任何时间把一个人拉入一个Wave中。(与其说是Wave不如说是Topic) 可以对消息进行再次的编辑、删除操作。 playback,回放可以让后来的人了解过程或者回顾讨论的顺序,比如讨论过程中拉了谁进来,谁说了什么话,谁修改了自己的或者别人的发言,哪句话被谁在什么时候给删除了等等,Wave让我们了解了这是一个过程。 就上面这些功能就足以让我们不必到会议室进行讨论,而是直接在线上进行交流,快速的讨论,如果讨论过程中觉的某某人也应该参加这个讨论,那么就把他拉进来吧,就是这样,很简单,但是我们有会议记录,可以回放的会议记录。相对于会议室,缺少的可能是一个白板,我相信不久就会有这样的Widget出来。 科技创新改变生活方式,也改变行业的规则。twitter提供了个人的即时广播电台,YouTube提供网络电视,Wave提供了网络会议室,Facebook提供了网络的社会关系。如果有一天机器人可以送快递,我们就真的可以足不出户的生活了。 BTW: 当国际科技发展在改变国际友人的生活方式的同时,国内科技的发展同样的在改变国人的生活方式,比如翻墙。鬼子们通过网络(也许是免费的)看YouTube 1080p高清电影的时候,我们还在为自己1M ADSL付费。

那个洞

在Practice of System and Network Administration中有一章是Climb out of the Hole。这个洞就是: 一个家伙掉到了一个深到他不可能出来的洞里。他听到有人来了,然后他引起了那个人的注意。那个路人听完了他的境况,想了一会儿,也跳进了那个洞。 “你为什么要这样做?现在我们都被困在这儿了。” “呃〜至少你现在不再孤独了。”那个路人说。