年会一日精要

早上到得比较早,或者说年会开始的比较晚,接近九点的时候才开始清场,10点才开始安替的年会keynote。对于安替的这个演讲我有一些疑问,后来在下午找了个时间和安替单独谈了谈。

安替有几个比较重要的观点,中国的Blog是媒体人在新媒体的尝试,也就是Blogger精英论,而不像是欧美那种反传统媒体的性质。与Isaac的Blogger草根论有着不同的观点。
他希望对中国的媒体进行联合,对新闻的好坏设立统一标准,换句话说就是建立中国的普利策。

据说是在安替演讲的时候,警察叔叔来了。
IMG_2216

欧宁演讲的时候后场就比较吵了,到了冯大辉讲的时候,他就哭丧着几乎要逃离讲台了。
余敏玮的内容挖掘我觉得很有意思,因为我一直都想学Data Mining,不过他们目前不对Blogger提供服务。我觉得可以开发Blogger知名度、口碑之类的信息服务。

下午就没有好好的坐在会场,在外面参与小组讨论。

首先是和安替。我对“媒体应该有统一的好坏标准”感到不解。安替解释说,其实主要还是精英论和草根论的差别,而且,安替这个演讲的主题,根本不是新媒体,而是传统媒体如何利用新媒体,借助新媒体保存自己,在中国这样一个新闻不自由的国度里伺机反扑。安替总结传统媒体——报纸,在一下几个方面比新媒体有优势:社会认同感,信息满足感,覆盖面/价格。(大意)
社会认同感是说,新媒体,如RSS订阅,在不同人之间基本上是不相同的,并且RSS订阅会使人的阅读面越来越窄,因为个人会订阅自己喜欢的,退订自己不喜欢的。但是这个社会需要一个东西,为所有人创造共同的话题。就像是同事间闲聊会聊起昨天晚上的新闻联播一样。
信息满足感是针对RSS的信息过载来说的,有人的Google Reader是1000+未读,这个就有一个压迫感,即使你早上10点读完了,说不定11点又会冒出几条,这个可怕的信息饥饿压迫没有尽头。但是报纸不同,早上一杯牛奶,一份报纸,一天的新闻阅读就完了。
覆盖面则是一个很有趣的问题,不要以为网络有着最大的覆盖。事实上,广大的农村并没有那么好的条件能够利用网络媒体,但是传统报纸能够填补这个空缺。
以上这些都是假设在一个完全自由和充分发展的媒体条件下,对于一个普通读者的优势。显然这样的环境是现今的美国,中国要到这样的条件,可能还要很多年。
在敲这份精要的时候我又想到几个问题:Google Reader Share的功能在一定程度上解决了认同感的问题;而覆盖面的问题,由于中国离这一天还不知道有多少年,技术的进步会不会消除报纸的覆盖优势?

然后是和维基百科的meetingup,我询问了一下解封之后中文维基的文章增长情况和访问量,结果很惊讶的发现,除了短暂的增长,情况和解封前几乎没有本质的变化。我将这种情况解释为鲨鱼的玻璃隔板实验:大家内心中都没有意识到中文维基已经解封了。另外还有维基编辑器过于复杂,和一个缺乏协作的心理问题:维基的文章要求是高标准的,但是并不意味着必须由你一个人达到这个标准,你可以完成一部分,然后加上合适的模板,自然有人会接受剩下的工作。
维基百科由于“过于民主”,所以对于很多提议都是漫长的表决过程,结果往往是提议者失去当初的兴致。

再接下来是和菜头和feng37的PK,说PK过于夸张,因为事情很简单的以feng37的“我晚上也想了很久”这样的道歉告终。不过我始终认为和菜头宣称的“新女权运动的失败”论断过于主观。后来和菜头讨论宣扬普世价值的手段,他认为大段说理是没有效果的,因为真正的目标受众才没时间看那种东西,要掰碎了,融入到生活中,才会起到效果。他举例说徐静蕾,如果在Blog中抱怨政府单双号分流,效果比一个法律专家大谈物权、人权要有效果的多。(但事实是徐静蕾很支持政府的做法,这点让和菜头骂了粗口。)

和菜头

后来和羊城网的小劳,以前并不认识,谈压死骆驼的最后一根稻草,以及林嘉祥和杨佳案的程序正义问题。小劳认为林嘉祥案是程序正义的,处理甚至是过于严重的。因为以已经发生的事实来说,林嘉祥只说他做了,做了什么却没有说,也没有做成功。所以对于当时的动机完全就没有任何认定依据。他举例说,如果小女孩是高官家庭,林嘉祥是普通打工仔,民众是不是会改变看法同情林嘉祥呢?以身份论罪,与文革又有何异?

接近5点的时候,连岳出现了。不是我认出来的,是和连岳吃过饭的amoiist认出来的。

连岳

唉?你以为连岳应该有40岁了吗?
没错…连岳有38岁…该死的baby face……

晚饭和几个Blogger一起吃的,本来是两组人一前一后进入餐馆,然后有人说,干脆坐一桌吧!
于是这两群不认识的人坐在一起边吃边侃。
参与年会的Blogger们都很亲切,仿佛是相识多年的朋友一样。

网络信用系统(四)

本来会有结语的,不过要说的好像在《伟大的读者》里面都说过了,所以这里直接给附录。

五、附录

下面列举一下推荐的新闻源,著名的VOA等媒体就不提了。

  1. 草莓周刊书签 虽然草莓周刊停了,但书签还是有更新
  2. Isaac的twitter 我曾经笑称给Isaac灌一瓶吐真剂就可以抓到中国一大半的右派,这一点都不是戏言。注意他的retweet,以及看他还follow了哪些家伙
  3. 本人的Google Reader Share 如果你喜欢看我的Blog的话,也许也会喜欢我共享的文章
  4. 河蟹上岸 站如其名,专门列举“和谐”之故事
  5. 连岳的第八大洲 我犹豫这个要不要算到VOA那种不必提的行列
  6. 人渣经济笔记 经济方面的分析,相当的有水平
  7. RSSmeme中文 Google Reader中当日被分享最多的文章,前段时间更新过后偶尔会冒出广告,但大部分情况下文章都不错

以上面这些新闻源作为起点,相信你可以建立起自己的可信新闻源。

(全文完)

伟大的读者

今天又看到了song的评论,让我知道他不会像五毛党一样扔下评论就走掉,而确实是认真的读过我的文章,认真的在研究问题。
在写《网络信用系统》之前,我没有怎么去搜集已有的文献,只是感觉没有见到关于这个问题的中文文章,因此才决定写这个东西。如果说我的目的是抛砖引玉的话,那么,目的似乎已经达到了。
订阅本站评论的读者好像不多,所以我全文转载song的评论,并且以斜体加上我的注解。

你的网络信用系统,我觉得说了两个事:
第一:
新闻源划分
”新闻源可以分为两类:自主提供新闻来源的一手新闻,和参考其他一手新闻来源的二手新闻。
而新闻的内容又分为两部分:新闻事件本身,和附加在新闻中的媒体的主观态度。 “
第二:
新闻信用评级:
新闻信用阈值:sum(一手新闻源信用度)=>用可信的二手修正
新闻源信用度:审查过去记录直接评定+根据引用关系将信用度推广。
基本上就是说网上有报料也有传言。做考证要找到报料的,看他信不信得过。信得过的人相信的人一般也信得过。
几点看法:
1.你触及了一个很重要的问题。
2.很多猛料是草根爆的。而且他们是以后暴料的主力。很多传统媒体也认同这一点,比如cnn的ireport。他们的信用度无法用历史考证。很多草根一生就报一个猛料。
3.你忽略了网上很重要的一个东西:聚合新闻的场所:wiki,著名论坛,一些rating system.很多料是因为在这些地方浮起来才得以为我们所知,而这些地方也有及其重要的鉴定真伪的功能。wiki的策略做的就很非常好,当然我们知道不是足够好。(我其实有提到过社会性媒体的)
4.对于传统媒体来说,一般一个事很少有两个以上一手爆料者,特别是国内。大家都有默契和平衡。而且相加这个运算不是很合适。比较合适的是可信概率运算:
1-p=(1-p1)(1-p2) (国内媒体多使用新华社通稿不能算多个新闻源,而且你肯定知道我对国内媒体的态度。至于可信概率运算,在数学上把可信概率设为0~1之间当然没错,不过我个人倾向于不设定它的上限)
5.你提出了一个原始的没有外界用户参与的信用系统,供个人使用。但站在开发者的角度,开发一个多用户参加的信用系统放网上更划算(software as a service),而且可以利用的信用甄别信息更多。我假使你提出这个系统的目的是要做一个支持软件/网站,因为你这个“系统”跟“浏览常识”的主要区别在于你尝试把事情量化,逻辑化。(其实我的本意就是希望能依此完成Google Reader之类阅读器的评价插件,或是Digg类站点。但是,我没有这个编程的能力。)
6.一些比较专业的相关资料,供参考:(有时间我会看)
Trusted Systems; March 1997; Scientific American Magazine; by Stefik; 4 Page(s)
TrustMe: anonymous management of trust relationships in decentralized P2P systems
Aameek Singh   Ling Liu
Coll. of Comput., Georgia Inst. of Technol., Atlanta, GA, USA;
Peer-to-Peer Computing, 2003. (P2P 2003). Proceedings. Third International Conference on Publication Date: 1-3 Sept. 2003
Reputation systems
Communications of the ACM  archive
Volume 43 ,  Issue 12  (December 2000) table of contents
Computing and using reputations for internet ratings
Electronic Commerce  archive
Proceedings of the 3rd ACM conference on Electronic Commerce table of contents
Year of Publication: 2001
Bayesian Network Trust Model in Peer-to-Peer Networks
Book Series     Lecture Notes in Computer Science
Book    Agents and Peer-to-Peer Computing
Measuring Levels of Trust
Laurie L. Coucha and Warren H. Jonesb
http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6WM0-45K13RV-D&_user=10&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_version=1&_urlVersion=0&_userid=10&md5=5414de0294d46d97ad01e0a6c1dfc8c0
Towards a Generic Trust Model – Comparison of Various Trust Update Algorithms
Book Series     Lecture Notes in Computer Science
Book    Trust Management
http://en.wikipedia.org/wiki/EigenTrust
Google的page rank也是在跟这些人比较近的一个research community的工作基础上做出来的。
7. 一些实验性的系统:
http://trust.cse.ucsc.edu/
http://trust.mindswap.org/
http://www.advogato.org/article/261.html

其实我自己也曾想过在这方面写点东西,但是一直没时间。也可能就不写了,因为已经有人已经把我能做的都做了。
你思考的很多问题是好的,但是鉴于网上一般有n个以上牛人同时专业研究那个问题,你最好把问题表述的简单平实一些,这样有利于可持续性的建设性思考。并在提出自己看法前多看看已有成果,这样你才不用做重复脑力劳动。(使用那种艰涩的数学式表达的原因在上面第5条的注解已经提出)

“如果你读了The Meme Machine就会知道,Blog作为一个Meme聚合体,在本质上就是要寻求自身的复制。说简单一点,写Blog本质就是布道。况且我又不是没开评论。”
是的,没错。你想说什么是你的自由。我说我不喜欢你的腔调也是我的自由。
http://www.rongshuxia.com/channels/zj/channelz/acheng/wen5.htm
(王朔):“说到文章,你一提这问题,我脑子里就有一比:我和陈村是那种油全浮在水面上的,阿城,是那种油全撇开只留下一汪清水的。论聪明,这个不好说谁更聪明;论见识,阿城显然在我辈之上。谁像他那样十年都在世界上跑,而且现在还在跑,这在文章中就显出来了。我看去年他在《收获》开的专栏,讲常识,句句都是断根儿的道理。同时在上面开专栏写“霜天话语”的余秋雨跟他一比,就显出力绌,不过是一些世故的话,家常看法,不说也罢。这个人对活着比对写文章重视,幸亏如此,给我们留下了活着的空间。”
接触到国内很多对网络感兴趣的年青人,可惜都很热心用概念和名词把自己的脑子给填的凌乱不堪,一路高歌猛进的成为网络织成的巨大Meme Machine中没有个性的个体之一。有灵魂的人,不该满足于此啊。(如果你看到上面我对第5条的注解,也许就会稍微改变一点看法。)

我对我在上篇文章中的恶言道歉,你是一位伟大的读者。
PS:网络信用系统还有最后一节,将会是最实用的一节:附录。

网络信用系统(三)

在正文之前必然有废话。
song说我在灌输不是在讨论,如果你读了The Meme Machine就会知道,Blog作为一个Meme聚合体,在本质上就是要寻求自身的复制。说简单一点,写Blog本质就是布道。况且我又不是没开评论。
说我《网络信用系统》幼稚,对这点我完全的接受,我在(一)里面就说过,这篇文章本来就是初学者入门级的文章,你觉得幼稚,你可以反馈给我一些更深刻的内容啊。一方面说我在布道,另一方面又不肯参与,好像是我没给你机会?

和菜头最近提到在网络上甄别信息真假的难度空前提高,我仍然认为这篇文章有必要继续下去。
有意见和建议,可以在评论中提出来。
觉得实在臭不可闻,也可以退订。

三、信用系统模型

有了前文的基础,这个模型的建立非常简单。
每个新闻源都有自己的信用度,每个新闻也有对应的信用阈值。
对于某个事件来说,将所有发表了该新闻的新闻源的信用度相加,如果超过了该新闻所需的信用阈值,则该新闻判别为真。这是一个数学化的表达方法,换作日常的表达,四个字:三人成虎。
唉,三人成虎不是这么用的吧?
所以这个模型当然有修正的地方。

根据新闻源的分类,二手新闻源相互转载是不会重复累计信用度的。甚至可以说,二手新闻源自身是没有信用度的,它的信用度完全来自于它所转载的一手新闻源。
但另一方面,二手新闻源又是相当重要的,因为一个良好的二手新闻源,其实已经对一手新闻进行了甄别。而且毫不夸张的说,这种甄别相当的耗费时间。(保守的说,我每天都会花掉3个小时阅读各种新闻,然后评论和共享之。)

每个新闻也有不同的信用阈值,这点不可忽略。
举例来说,贵州瓮安市民放火烧了警察局,和深圳市民放火烧了警察局,这两条消息,需要的信用度是不一样的。我不是说深圳市民就比瓮安的要文明,我的意思是,大城市的警察比小地方的密度高,想要烧掉警察局,那还真是很不容易的一件事情。

四、信用度的建立和传递

依靠什么来判断一个新闻源是否值得信赖?这个问题和Google判别垃圾网页有着相似的地方。
传统来说,判断一个新闻源的信用度,只要从这个新闻源已经发表而且被证实为真的新闻数量/比例来看就对了。这样做显然有些麻烦,你必须回头去找每一个新闻源的历史存档,看看他们报道过什么。而且还得警惕他们可能作弊删除或修改以前的稿件。
因此有一个变通的办法,假设你已经确定一个高信用度的二手新闻源,可能是你的朋友,可能是某份网络杂志如草莓周刊。那么这个新闻源经常引用的前一个新闻源也是可信的。是不是像PageRank或是人际关系的传递呢?
依据这个传递的原则,你可以找到大量的可信新闻源,多到你信息过载。
由此可以看到,retweet在twitter的意义。

网络信用系统(一)

我在《信息控制三部论》里,描述过新闻/信息是如何被操纵和扭曲。既然有矛,就应该会有盾,否则我只是向大家展示了一个不可避免的悲观的未来。
在这篇文章里,我会试图总结一些关于网络信用的基本原则,其中有不少看起来都是相当浅显的废话,因为能看到这篇文章的人,已经不是一般的网民。

一、基础工作/前言/无论你叫它什么都好

你一定得知道GFW以及对抗技术,至少能有可用的代理,不管那是Tor、无界、自由门、或是你花钱买来的VPN。你得保证GFW叫你看不到的东西,你都可以想办法看到。因为那边的真相比较多一些。如果你身在某个资本主义国家,就当我这条没说。

你要知道RSS是什么东西,并且开始使用一个RSS阅读器(推荐Google Reader,要用https版),因为大多数新闻源都会提供RSS订阅,不论是全文或是摘要。(不要跟我提新浪、163!)订阅了RSS之后,你可以确保第一时间看到新的消息。

尝试一些社会化网络,虽然天涯、凯迪也是不错的论坛,但是受到国内拘束,很多问题没法讨论。你应该去尝试一下TwitterFriendFeed等,有很多网友会及时的同朋友分享最新的消息。举个例子来说,今年512地震,Twitter上一群网友最先找出震中和强度。

保持一个清醒的头脑,不要被任何情绪冲昏理智。情绪化往往是被欺骗的开始,对一切事物都保持适度的怀疑是比较精明的做法,不论这个消息符合或是违背你的固有观念。

乌鸦嘴

经过一个星期的动荡,我在广州盗用一个幽幽的未加密的AP更新这个Blog,宽带可能还要等到发工资才会有钱安装。

最近发生了很多事情,我在手机上用Google Reader和Twitter了解和评论着这些事情。
这些事情很让我痛心,更让我痛心的是,仿佛是我在指点一样,我几乎预言了这些事情的发生。

鲁迅的文章从义务教育的课本中删掉了,因为和谐的社会主义没有“惨象”和“谣言”。
贵州事件一开始没有完全的封锁消息,后来则采用舆论引导和封锁反对言论的方法迅速的平息了事态,让我感觉到信息控制的可怕。
我有次开玩笑在Twitter上说奥运期间GFW将从黑名单制改成白名单制,今天传来国外大部分网站无法访问的消息,不得不让人怀疑是GFW的技术升级或是热身。

真是乌鸦嘴,不吉利的事情都灵验了。

即使这样我也还要说一件事情。
社会上最近热捧80后的现象,即使自己作为一个80后,我也觉得不对。
上一辈批评下一辈,这个似乎是历史常态。
美国那“垮掉的一代”成长起来了,却也没有让美国垮掉。

热捧80后,意味着80后开始掌权。
这有什么不好的呢?
主流媒体就会开始批90后,因为总得有人被骂。
但是我认为90后其实有很多80后所欠缺的东西,比如“自由精神”。
贵州事件主要参与者据说也是90后。
当80后成了掌权者,他们可能会安于这种社会结构而批评不安分的90后。
而这种批评,也是70后被80后所不屑的东西,也许可能损害这份自由精神。

如果有希望,希望在90后身上。

四川地震

不要以为我不知道四川发生地震了,地震发生的时候我就在Twitter上面看到全国各地的人说地震了。
然后综合各方消息,追踪后继消息。在这种突发事件上,Twitter扮演着比传统媒体更为重要的作用。

地震的详情大家应该已经知道了,不知道的可以看看下面几个链接:

豆瓣上有捐助的方式,因为中国红十字会的网页已经没法打开。

二十多小时已经过去,受灾群众生存的希望越来越小,汶川的道路却似乎还没有打通。
中国政府已经拒绝了外国物资和人员援助,仅接受金钱援助,理由是人员和物资没法送达。[来源]

请在天安门降半旗!
请暂停奥运火炬的传递!

PS:为什么都江堰倒塌了那么多学校,而不是政府建筑!

更新:据说来自汶川核心区的照片

What is blog?

我昨天考虑这个问题,觉得我试图把Blog变成个人Friendfeed是错误的做法。

所以现在,我把Twitter每日摘要的功能关闭了。
让Blog的归Blog,Twitter的归Twitter,书签的归书签。

想看碎碎念的去订阅Twitter,想看照片的去订阅Flickr,想看共享文章的去订阅Google Reader。
当然,也可以一股脑的把我的Friendfeed订阅下来,如果你真的对我这么感兴趣的话,欢迎你加我的Google Talk好友……

这里只会出现一些不短的文章,也许还有图。因为有句话叫”A picture is worth a thousand words”。
因为最近沉迷Twitter,所以Blog更新频率有所下降。

就是这样子了。