首页 > V2EX > V2EX-中文独立博客的年化“腐烂率”——8%
2022
02-06

V2EX-中文独立博客的年化“腐烂率”——8%

yzqzss:

统计了 1000 个中文独立博客,我算出了他们的“腐烂率”

数据来源: https://github.com/saveweb/rss-list
总计:965 个博客
托管于 Github Page 的博客:182 个(不包含使用了 CDN 代理 Github Page 的博客)
腐烂的博客数:113 个(不管网站是否删过内容,换过域名,只要博客主体存在,就不算腐烂)
统计持续时间:17 个月
中文独立博客定义:
    - 包含:独立域名 和 eu.org 、github.io 、gitlab.io 、gitee.io 的三级域名。
    - 不包含:wordpress.com 、网易博客、blogger.com 等的三级域名。

经过简单计算,中文独立博客的年站点腐烂率为 8.26% ,换句话说,每年约有 8%的中文博客会消失(被其他网站采集,如 archive.org ,也算消失)。

以此类推,现在这一批中文独立博客在 8 年之后,会有 50% 消失(0.9174^8)——半衰期是 8 年。15 年之后,现在这一批中文独立博客将有 70% 消失(0.9174^14)。但互联网日新月异,未来腐烂率的数值是多少谁也说不准。

不过中文独立博客的年链接腐败率暂时难以量化统计(需分析收集到的 59447 个博文链接,要花上一些时间,有时间我会统计一下),但只会比站点年腐烂率更高。因为很多博客会出现数据库丢失、更换域名、博主主动删除文章、迁移博客程序等一系列导致永久链接失效的情况。所以我主观估计中文独立博客的年链接腐败率在 20~30% 左右。

同时,我们发现越来越多的中文博客选择使用静态博客程序并托管到 Github 、Gitlab 、Cloudflare 等 Pages 服务上,这一趋势无疑对减小腐烂率有益。且用户友好的低技术托管平台有助于中文独立博客数量的提升(网上一堆静态博客入门教程)。但需要指出的是,选择 Pages 服务托管静态网站本质上和选择 Blogspot 、WordPress.com 等第三方博客托管平台并无区别,仍然面临平台倒闭或事故导致数据丢失的集中隐性风险(假如 Github Page 现在停止服务,我们将瞬间丢失至少 20% 的中文独立博客)。

而短期来看,自托管(self-host)博客仍然是风险、成本、技术要求较高的选项,比集中化的平台更容易发生链接腐烂的情况。


https://blog.othing.xyz/archives/chinese-independent-blogs-link-rot-2022.html

from V2EX-最新主题 https://ift.tt/CvVUYED
V2EX-中文独立博客的年化“腐烂率”——8% - 第1张  | 牛C网(NiuL.Net)
牛C网:https://j1o.net
牛C网导航:https://niuc.icu
零九导航:https://09.gay

最后编辑:
作者:分享菌
这个作者貌似有点懒,什么都没有留下。

留下一个回复