把blog从archive.org恢复回来了

冗余不做,日子甭过,备份不做,十恶不赦。

对于自己的blog之前做的备份都已经失效了,放在vps上,一个手快释放了一台,就跟着灰飞烟灭了。

今天花了一点时间写了个脚本把以前的文章从互联网档案馆[archive.org]1里给捞出来了,算是恢复了,部分文章的格式不对,评论都没有了,也是损失惨重。

先用了 [hartator/wayback-machine-downloader]2 把文件都down回来,然后再用 Python 逐个html里翻文章出来,最后输出成一些通用的格式再导入就好了,[脚本在此]3


  1. https://archive.org ↩︎

  2. https://github.com/hartator/wayback-machine-downloader ↩︎

  3. https://gist.github.com/khsing/2f93e8a6fdb2d38b974a8229684de785 ↩︎


Last modified on 2019-01-15