8/11/08 – 中国特色。NET

在正文之前必然有废话。
song说我在灌输不是在讨论，如果你读了The Meme Machine就会知道，Blog作为一个Meme聚合体，在本质上就是要寻求自身的复制。说简单一点，写Blog本质就是布道。况且我又不是没开评论。
说我《网络信用系统》幼稚，对这点我完全的接受，我在(一)里面就说过，这篇文章本来就是初学者入门级的文章，你觉得幼稚，你可以反馈给我一些更深刻的内容啊。一方面说我在布道，另一方面又不肯参与，好像是我没给你机会？

和菜头最近提到在网络上甄别信息真假的难度空前提高，我仍然认为这篇文章有必要继续下去。
有意见和建议，可以在评论中提出来。
觉得实在臭不可闻，也可以退订。

三、信用系统模型

有了前文的基础，这个模型的建立非常简单。
每个新闻源都有自己的信用度，每个新闻也有对应的信用阈值。
对于某个事件来说，将所有发表了该新闻的新闻源的信用度相加，如果超过了该新闻所需的信用阈值，则该新闻判别为真。这是一个数学化的表达方法，换作日常的表达，四个字：三人成虎。
唉，三人成虎不是这么用的吧？
所以这个模型当然有修正的地方。

根据新闻源的分类，二手新闻源相互转载是不会重复累计信用度的。甚至可以说，二手新闻源自身是没有信用度的，它的信用度完全来自于它所转载的一手新闻源。
但另一方面，二手新闻源又是相当重要的，因为一个良好的二手新闻源，其实已经对一手新闻进行了甄别。而且毫不夸张的说，这种甄别相当的耗费时间。(保守的说，我每天都会花掉3个小时阅读各种新闻，然后评论和共享之。)

每个新闻也有不同的信用阈值，这点不可忽略。
举例来说，贵州瓮安市民放火烧了警察局，和深圳市民放火烧了警察局，这两条消息，需要的信用度是不一样的。我不是说深圳市民就比瓮安的要文明，我的意思是，大城市的警察比小地方的密度高，想要烧掉警察局，那还真是很不容易的一件事情。

四、信用度的建立和传递

依靠什么来判断一个新闻源是否值得信赖？这个问题和Google判别垃圾网页有着相似的地方。
传统来说，判断一个新闻源的信用度，只要从这个新闻源已经发表而且被证实为真的新闻数量/比例来看就对了。这样做显然有些麻烦，你必须回头去找每一个新闻源的历史存档，看看他们报道过什么。而且还得警惕他们可能作弊删除或修改以前的稿件。
因此有一个变通的办法，假设你已经确定一个高信用度的二手新闻源，可能是你的朋友，可能是某份网络杂志如草莓周刊。那么这个新闻源经常引用的前一个新闻源也是可信的。是不是像PageRank或是人际关系的传递呢？
依据这个传递的原则，你可以找到大量的可信新闻源，多到你信息过载。
由此可以看到，retweet在twitter的意义。

S	M	T	W	T	F	S
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Day: November 8, 2008

网络信用系统(三)

天龙八部操