互联网时代,依赖人肉样本库的内容分析是不靠谱的

最近半年陆续接触内容数据分析的工作,对于广告行业,有点感悟.
广告行业很认可建立样本库来推导整个市场的情况,来支持其购买媒介资源的依据.
这是有历史原因的,早期的电视,户外广告等都是单向传播的媒体.电视台的播出时间资源总和其实是有限的.媒介售卖的其实是时间,
用户总要从中选择一个节目观看.对于市场而言电视的总播出时间和受众的基数是不变的恒量.
在这种情况下,样本库的调研方式是很有效的,电视面对的个体是家庭,国内有多少家庭,那么采用最少的样本库的规模,大致是多少.
样本库的方式有哪些缺陷?
样本库的方式对于大流量精品内容的分析,是可行的.但对长尾的检测对象的分析会有很大的问题.
这个和alexa的原理是一样的,alexa排名对于大站是比较靠谱的,对于小站是极度不靠谱的,网友可以通过网络找找相关的文章.

看到国内几家公司都在依赖于样本库的方式来做买后分析,和买前分析.
比如admaster,秒针,GA的分析都是比较合理,逻辑上可行的. 广告既得流量,这些流量的量,远大于受众轮廓分析维度(地域,年龄,职业),不管怎么分配,都能得出大部分的流量归属. 这种样本库的分析方法是可行的.

而同时我看到一家神奇的公司,艾瑞同学,通过样本库(20W)的方式 可以神乎其技的调研各种(长尾)内容,品牌的数据调研报告.
我个人认为在逻辑上是行不通的.

互联网的内容分析,能不能通过样本库的方式来做? 答案是 大流量内容的可以,长尾流量的内容是行不通的.除非样本库规模足够大(亿).
互联网的内容 有自己独特的特点,内容每年呈几何级数的爆炸式增长,在用户周围充斥各种内容.用户与内容之间的距离越来越远,这也是google,百度公司的搜索价值凸显出来的原因,在早期内容不足的情况下,网友只需关注门户网站就好了.
互联网的视频内容,网友可以随意点播.使用对象 是整个互联网网站+客户端,或单机客户端。
摆在用户前面的是海量的内容,及有限的时间. 简单的通过(1000W以下)人为协商安装软件样本库去分析长尾内容是极度不靠谱的.
当你的样本库不够大(20w),用户在可选择的内容过于丰富,用户对于某部电视剧,某期综艺节目的选择在某个时间点,是几乎很难有交集.
这个在电视机时代是不存在这个问题的.相对互联网内容,电视的内容少了N个数量级.

在理论层面,网络的、数据传播,在主干线路,电信、移动运营商平台,走海底光缆各种途径.可以设置种种的检测关卡,都可以监控所有HTTP请求的数据,然后统一分析内容的欢迎程度,这也是极度靠谱的,Google做DNS解析,恐怕也是想知道什么网站内容好,什么网站内容差吧。

对于用户的分析,依赖于 平台级的互联网产品,比如百度,腾讯庞大的用户群,依赖于用户行为的分析,分辨出用户的属性.
这种方式获的数据,也远好于样本库的分析用户的方式。

因此艾瑞公司依赖于样本库的内容数据检测公司,全网检测内容数据,发布各种长尾内容数据分析报告.这种数据是极度不靠谱的.
如果是大流量的精品内容数据,这家公司又是没有价值的,因为百度指数,google trends比他们好N倍,样本库 尼玛呀。

所以 我力劝这种公司早点关闭这种不靠谱的部门,做咨询公司该干的事情吧.

在互联网文字时代,判断内容的优劣,做的最好的是搜索引擎,百度与google.其他公司都是纸老虎.
至于在视频和图片时代,google 公司也是牛B的一塌糊涂,百度和其他公司暂时也是纸老虎.

 

互联网产品形态的思考

在QQ群和同事讨论关于C用户电视剧的互联网产品形态,思维过度发散.

在这里把碎片化的东西记录下来,多年以后看看思路不对的地方,也是一件很有趣的事情.

对于电视剧这一块,目前的产品定位格局是[不全]

1)看电视剧 {刚需} 在优酷、土豆、奇艺、迅雷,QVOD等视频网站和客户端,这个不需要解释,大家都懂的.

2)  电视剧评论,签到{弱需求}[电影的评论\点评是强需求]在豆瓣,贴吧,verycd.

豆瓣是一个奇怪的社区,我们来看一下我的使用轨迹.

豆瓣搜索{主题分类,关键词,标签}->评分{排序}->百度{qvod,百度影音}->返回豆瓣看好的影评.

这是我使用豆瓣电影的 轨迹,但对电视剧这种播放总时间较长,偏重电视剧情节,人物讨论的物而言,豆瓣做的其实并不好,为什么?豆瓣是一个以搜索,评分,推荐的地方,允许小众的、长时间的沉淀物的地方;而不是一个短时间爆发的讨论的,话题热议的百度贴吧这么一个地方,因此从物{电影、电视剧}之间的差异性而言,我认为 百度贴吧的产品形态在电视剧方面甚至比豆瓣更贴近用户.

进一步阐述原因和理由 电视剧是一个贴近普通大众的,茶余饭后的,拉近人与人之间距离的 kill time 闲聊的主要的物. 它天生需要热播期间扎堆闲聊的刚需,你不能和周围的人闲聊 1年前的某部电视剧吧?别人不说你是疯子,就认为你是傻子.但电影不同,电影是一个可以短时间爆发聚焦话题的东西,也可以长尾小众的讨论的物,它不会随时间流逝而失去点评和再次观看需求的价值.

因此豆瓣的电影是非常优秀的,虽然这个产品我认为有少量不完美的地方.比如单纯的物的签到而言{看过,想看,正在看}除了内容相关性之外,我看不到任何用户与用户社交的刚需.还有对于网络文学{非正规出版物},UGC的电影短片,豆瓣没有拓展下去,当然豆瓣的今日成功更多在于社区{群组,活动,本地化},暂不做讨论.

贴吧 其实就是一个论坛,一个扎堆闲聊的地方{刚需,2,3城市老少皆宜,和国粹麻将有的一拼}.

百度贴吧是一款 一目了然的,普通C用户再熟悉不过的,简单到无注册可以参与讨论的 产品,国内没有其他产品比贴吧更简单了.

贴吧是 扎堆闲聊的地方,一个聚焦实时热点讨论的地方,话题会随时间的流逝,而渐渐的让人淡忘,这就是贴吧的定位.

贴吧注定不是电视剧 结构化信息的地方{评分,喜欢的人},不能告诉用户什么电视剧的评分.相同的电视剧推荐.

verycd 这个老牌的下载站,在吃几年前攒下的口碑和品牌,算是电视剧播放流量的一个入口,用户会在讨论区讨论,和贴吧一致,不做发散了.

3)电视剧节目预告,{tvmao} ,网页版的这东西,没啥有趣和前途的,不做发散了。

4)关于电视剧 一些莫名奇怪的需求,在百度知道(比如某部剧某个明星的手机铃声,衣服哪里有卖),电视剧里面的内容-》淘宝这个也是弱需求,电视剧的物品导购流量的CPS ROI远低于硬广告的价值,历史常识告诉大家 ROI的层级太多,效果降低是几何级数的.

——————-

一款成功的C用户产品有那些特征呢?

我自己总结认为有3点
1)创造内容(UGC)
2)缩短用户与内容的距离 (搜索、推荐)
3)社区内容的再组织能力

关于第1点和第2点这个不阐述原因和理由了,大家都懂的.知乎有各种问题和答案提供给大家解惑.

关于第3点 内容的再组织,如 最近的国外很火的瀑布流,我认为它属于这一分支,不过我始终没有找到一个理论去支撑 转帖应用的价值到底有多大?至今看衰这种模式的东西,至少在中国不适用.

蘑菇街 也是瀑布流,你可以认为蘑菇街也是再组织的,不过蘑菇街也属于缩短了用户与内容的价值,蘑菇街通过产品的策略,把淘宝的质量不一的图片过滤成 非常漂亮的图片集合,缩短了用户与内容的距离,因此对用户而言也是有价值的.

——————

对于一个电视剧的C用户产品形态,如果你不能符合上面讲的3点,或是和现有产品的诸多形态有冲突,我劝各位还是洗洗睡吧,互联网上已经有太多重复内容了,做点其他事情也许会更好.

 

上海创业小公司 求贤若渴,欢迎大牛加入

hi,各位即将毕业的学弟、学妹:
我是交大03级机电学院的老油条,在校时不好好学习,毕业后从事互联网行业.{更多我的信息 paitoubing.42qu.com}
我们正在招聘优秀的应届毕业生,我们公司主要给企业{影视投资公司、影视制作公司、电视台、国际4A}提供 数据挖掘、影视内容分析等服务,帮助企业更好的决策服务.

我们公司的情况
目前公司有7个人,
今年营业额应该在 kw 左右.{是有点低,不过我们有信心拔高它}
属于快速成长的哪一类公司,
争取在2年内,能够达到10kw这个级别的中小公司.
我们希望保持这种短小精悍的团队结构,37signals是我们的目标 +_+.
更多公司信息请 移步 http://www.vlinkage.com/about/ {目前这个版本很糟糕 -_- }

在写招聘要求之前,谈谈我们喜欢什么样的大学毕业生.
《黑客与画家》里面描述高智商的黑客的特征包括
书呆子、不善于言谈、
逻辑思维、数学能力强等
如果你有部分或全部特征,我们会很欢迎你的,我们不排斥真正的人才.
我们非常渴望 有统计学 数学功底的 技术人员加入我们.

技术人员要求
数学不差、有过一门编程语言的基础、
如果了解面向对象、设计模式之类的伪科学 我们就更喜欢了.
如果你觉得自己技术不错,文字功底较佳,有阅读严肃文学的等习惯优先.
不要告诉我关于 你的计算机等级考试的成绩,否则我不会给你任何机会.
我们使用的技术架构[redis+python+mysql+php+mongodb+nginx+linux],如果你也玩这个,当然最好不过了.

产品人员要求
你知道FB不是抄袭校内,
听过用户体验这个词
知道hao123是个好产品但你从来不用它.
有过页面设计或是平面设计的经验者优先,有鉴赏 美 的能力者优先
[假如你认为 美是一种抽象的物,因人而异,那么在我的判断尺度中,你是没有鉴赏能力的]

关于成长机会
在我前几次创业经历中,陪我一起苦逼写代码的师弟们 毕业后 一般都在 腾讯、百度、淘宝、盛大、金山工作;
坦白来讲,我们看重的是你们的可塑能力,不care你在学校的成绩单,证书 ,我们不认为这些东西是衡量人才的标准.
[虽然在我职业经历中,我的report的对象4个是清华毕业的,我不认为他们的能力取决于这所学校]
我们没有大公司那一套所谓的先培训3个月、半年的机制,我们能给于你们的是参与真实项目的机会.

关于待遇
我们公司地点在上海,待遇4-6K,试用期 3k。

如你有兴趣,请发送简历给我们  邮箱: bruce.xu@vlinkage.com,我们会与你取得联系.

谢谢各位.

 

面向儿童的互联网市场调研

从盛大出来,稍清闲了一些,见了一些朋友,大部分是创业者.交流下来看了不少项目,我看以后我也别混产品和技术了,改行做投资更适合.
从接触的情况来看,想短时间内做成某件事情的人很多.能直接模仿的绝对不自己搞,而且很多人还在谈模式,无论如何,祝他们创业成功.
最近这些天 思考了很多, 关于 社区、人、物之间的关系,内容UGC的聚焦、还是人的聚焦,论坛、SNS、豆瓣这些产品的信息架构适用的场合,我很反对创业公司直接拿 这些产品来快速开发并迭代产品,不过不论是产品 还是老板也好,都是喜欢找一个产品直接套,然后想通过运营快速的做起来;
说了这么多无非是信息架构的问题.
国内产品设计(信息架构)人员还是挺稀缺,当然这是多方因素构成的.
OK,说了这么多废话,把最近帮朋友做的一个市场调研的节选(前半段)分享出来,大部分数据都可以从网上找到,我帮大家汇总了,背后的市场机会大家自己分析吧,我就不贴出来了.希望有些参考价值.
互联网覆盖率,普及率,产生了新的用户群(以后没啥机会了),新媒体\新渠道的发展带来了新的机会,新的内容产生机制UGC,特别是电子产品的发展影响很大.举例:以前只有陈冠希能自拍,现在普通用户都可以玩自拍了,在98-05年,某些论坛以AV动作明星影视分享为主,现在以偷拍,自拍UGC为主,以前以凤楼经历YY文章为主,现在主要以网友等成人交友经历为主;某个时段提供某种东西满足用户需求,太早?成了先烈.太晚?,成了跟风.未来的日子,揭竿一定是网络发动,大伙等着吧.

 

答 张沈鹏 问 : 大家觉得42区导航应该怎么优化 ?

答 张沈鹏 问 : 大家觉得42区导航应该怎么优化 ?
42qu是一个不错的社区,有很多互联网圈的人在里面玩.
—————————————–
@zuroc
喜欢42qu的简洁设计,先提点抱怨性的建议吧;
42qu的信息组织架构有点怪,导航左上角貌似是主导航,右上角是 当前页面的action?
如图所示:
abc
比如点击我自己live可以方便的发布信息对吧?
然后我点击感兴趣的人和物时,右上角变成了人和物我可能的action了对吧?
bca
逻辑是没有问题的;
一般来讲,如果是某个人和物内容页面,那么最好在内容区域布局(人和物相关的)action;
右上角统一是自己默认的(发布等)action,是不是更标准一些?

导航菜单等最好有一个标准,这样就像是使用操作系统一样,
我在右上角点击我自己的action,在内容页面有相关的action .

不过你这个设计有点像mac os的操作系统,导航和打开的应用有关,全在最顶部,
我开始接触mac os时也有点不爽,后来也就习惯不爽了.

在文章列表页面,最底部的回复区域.我点错了3次(刚开始玩42qu ,不好意思),都点击到了个人的homepage了.
回复区域的最左边的删除是最醒目的,这里不是提倡掐架的社区吧?

我倒是建议 分为左右2个区域;左边区域是留言者的信息,最好有头像,因为42qu的美女很多,这个很有必要,
而且42qu个人homepage的profile (about\photo)权重是不是要大于 feeds(动态信息)的?
这个我是从现在的个人homepage察觉的;

因此左边是头像不会影响42qu的定位(和zhihu定位不同,zhihu重内容,而弱化社交,因此头像在右边区域),
右边区域 有 删除、回复等action,并且回复的action要放在del的右边,方便鼠标点击 .

其他的page和我以往的使用习惯稍有不同,不过不影响我的使用.
-_- -_- -_-

 
 
About This Website

Lamp development & SEO & Plan of Website & Project Managment

Learn more »
Follow Us (SNS)
Help & Support

more about Bruce.xu»

Get in touch

QQ: +252339382
Email: shjuto @ gmail.com

Online contact form »