技术,互联网,eLearning …
标签类目:长尾

Google Reader的中文用户都在分享些啥

上周末写了个抓取程序,用来抓取Google Reader分享的Feed。由于分享的Feed里每一篇被分享的文章都列出了like该文章的用户ID,通过该用户ID可以拼出一个新的分享Feed。这样,以几个用户的分享作为种子,就可以获取大量的用户分享数据。

我的小破电脑吭哧吭哧地抓了一周,主要抓取中文用户的分享,其间又由于有些Feed里含有特殊内容而被connection reset了几次。到了周六早晨,共获得了11万个用户ID,其中,中文用户有2.7万(share或者like过中文文章的用户被认为是中文用户)。从抓取的过程来看,这2.7万用户应该是有过分享行为的中文用户里的绝大多数了。

被share最多的文章和被like最多的文章

对已经获得的数据做统计,被share最多的十篇文章是:

被like最多的十篇文章:

韩寒的文章被分享的次数最多,看来他的文章很对阅读器用户的胃口。另外一个被分享比较多的是可能吧,大家对IT类的科普文章还是很感兴趣的嘛。另外,同被share的文章相比,被like比较多的文章看起来知识性更强一些。

比较有意思的一篇文章是唐龙与藏獒(转),来自土摩托日记,被like和share的次数都很多,从标题上看是一篇转载文,不过用google搜索 “唐龙与藏獒”的时候,都是转帖,反而找不到该文章的原始出处和作者。看来一篇文章要想广为流传,不仅要有好的文章质量和独到的见解,还得借助有影响的媒介来传播。

用户的阅读时间

用户分享的Feed里有一个元素叫做gr:crawl-timestamp-msec,经过验证,这个时间在分享Feed里就是用户分享文章的时间。对这个时间做统计,就可以看出用户在哪些时间里使用阅读器。统计结果如下图:

阅读时间图

除了晚上睡觉的时间,用户在其他时间使用阅读器的频率似乎差不多,只能大约看出中午,晚上6点和晚上10点左右几个高峰期。这说明用户在工作时间也是在使用Reader的?

分享的长尾

对所有文章的分享次数做统计,最后得到一张图,很明显这张图与长尾理论的观点相符合。

分享的长尾

横轴代表文章,纵轴代表文章分享次数。少数文章被大量的分享,而大多数文章则只有一两次分享。

企业学习的长尾与注意力危机

本文是对Tony Karrer的Corporate Learning Long Tail and Attention Crisis一文的概述,英文原文在这里(需翻墙)。

如果你对于“长尾”这个概念不熟悉,可以参照一下维基百科给出的定义,也可以看一下 getAbstracts的Abstract on Anderson’s The Long Tail。其基本观点可以由下面这个例子来说明,Amazon网上书店销售了大量在传统书店里甚至不能看到的书。当商品的流通,存储和生产的成本降低到一定程度时,销售那些相对冷门的产品就变为可能。存在长尾的市场更倾向于生产种类不断增长的大量产品,而只有一小部分产品位于头部。这种情况经常会发生,比如Yahoo或CNN这样的内容提供者就要和大量的个人博客竞争,电视台则要和Yutube这样的网站竞争。

长尾图

由于每个人用来处理信息的时间是相同的,他们自然而然的要将时间分配到越来越广泛的领域,也就是所谓的注意力经济,在注意力经济里,稀缺资源不是分发渠道或者是信息,而是注意力,每个人所有的时间有限,只能关注那些重要的事情。这类似于将长尾图中的销售换成注意力。

对于学习组织和企业培训组织会产生的影响:

  • 企业培训组织更像是内容的生产者和分发者;
  • 知识工人面对正在增长的大量信息资源,企业学习只是其中的一小部分;
  • 在信息的使用方面,金钱成本不再是一个主要考虑的因素,时间成本显得更加重要,比如,我们选择我们所喜欢的搜索引擎是因为我们认为它可以帮助我们在最短的时间内获取最有价值的信息;
  • 信息源仍然在爆炸式的增长,企业培训组织做为传统的内容发布者只能满足一小部分需要;
  • 如果我们不能吸引注意力,我们就会被逐渐边缘化,获得注意力比以前更加重要,并且需要比以前更多的努力,企业学习处于注意力危机之中;
  • 企业学习组织正在寻找降低成本,扩大市场的方法——投入到长尾中去。他们需要e-Learning手段来降低内容分发成本; 企业学习组织如果要真正影响长尾,就必须面对eLearning 2.0 ;
返回顶部