跨站攻击PPT,及录音,因为录音是在家里面自己录的,前面比较低沉,还是现场有感觉呀。
时间有点长,前面是理论,后面是实战。
音频文件下载地址:跨站脚本漏洞.mp3
跨站攻击PPT,及录音,因为录音是在家里面自己录的,前面比较低沉,还是现场有感觉呀。
时间有点长,前面是理论,后面是实战。
音频文件下载地址:跨站脚本漏洞.mp3
作者简介:徐江涛,任职于盛大在线,LAMP 技术软件开发
加入盛大在线15天有余,看了很多关于盛大的东西,虽说以前一直比较关注互联网,但对盛大了解并不多,平时又喜欢写文字,于是就有了下面的文字.
“亚马逊”是全球领先的电子商务公司,“亚马逊”一直在创新,从全球最大的“网上零售书店”,到 “网上沃尔玛”,从单独的B2C平台,到现在引入第3方商户,集成B2C与C2C,引发了电子商务的一场革命;是全球最早一家为电子商务提供基础服务的互联网公司,开创了云服务,最早推出具有颠覆性的云端产品-Kindle。从这家公司的发展思路来看,还远不止现在我们看见的这些。
今天我们提及网上兜售电子出版物总提到“亚马逊”,是因为“亚马逊”最开始给人的感觉就是一家卖书的网站,“亚马逊”作为最大的网上内容提供商及最大的平台运营商之一,总难免会使人盲人摸象,显现不同的样子。国内任何一家内容提供商,几乎和“亚马逊”不是一个等级,不仅仅是内容的数量和质量,更重要的是亚马逊是一家平台型的企业,在美国出版行业甚至在电子商务的产业链有举足轻重的地位。
反观国内的出版界,中国出版界是截然相反的情况,据《2009—2010中国出版业发展报告》显示,2009年中国整个传统图书出版产业的总产值不到800亿元。这其中大约70%是各类教材、教辅贡献的,据说教辅的出版量仅占行业的一成,但利润却占行业的六成。如果去掉教材、教辅,真正图书产业的市场只有200亿元左右,而中国最大的网络内容提供商“盛大文学”,一直以奇幻鬼怪、言情等为主体,在整个数字出版物来看,也是很小的一个分支,是一种现今流行确非主流的文学题材。不过从整个盛大的布局来看,盛大在线是提供一个数字化内容产业链的地基将为整个数字产业提供网络服务的基础支持,在未来 音乐、视频、报纸、杂志、图书等等信息都将数字化;盛大开放平台提供的基础服务,的确会加速出版物的数字化。
盛大在线为第3方内容提供商提供支持的一个云平台,势必需要一个云端,Bambook应运而生了;从Bambook的CPU频率来看,远不止现在的电子阅读器,应该是一个类似IPad之类的角色,为什么现在不是?想必是盛大资源的整合 以及在 软硬件结合方面需要时间,在万事俱备之后,Bambook必将化蛹为碟,变成盛大自己的一个娱乐化(数字文化时代的)的云端产品。
“盛大文学”如何从中国图书出版行业的边缘化产品变成主力军,就像上面所说,在中国出版行业的主要利润来源于教学类的内容,一个Bambook如何切入这个市场也许不是那么容易;在传统的内容渠道中,盛大文学也并没有优势。
在这方面“盛大文学”与亚马逊的差距明显,甚至“盛大文学”中的拳头产品“起点文学”也是基于社区付费的,Bambook是希望拥有阅读习惯的人成为付费用户,以我个人的阅读习惯来说,我喜欢在线阅读但几乎不上起点阅读,因为起点奇幻文学的确不是我需要的;想必Bambook云端及“云中书城”是盛大文学在内容的多元化的一个布局,在基于“盛大在线”开放平台的基础上,在出版物数字化的大趋势下,“盛大云中书屋”正在加速传统出版行业的生态结构的变化,国内数字出版行业只有盛大最适合或最可能做这个领头羊。
“豆丁网”是一个分享和传播的媒介,它本身并没有创造内容,而是通过互联网的工具(“豆丁播放器”及分享社区)降低了文档在不同用户之间传播的成本。大部分文档都是早已存在用户电脑里,有PPT,DOC,PDF等格式,很多拥有此文档的用户几乎不对的内容进行维护,大部分人对文档没有版权,这是“豆丁网”必须要解决的一个问题;
“豆丁网”号称自己有多少数量的文档,但这些文档的内容质量却良莠不齐;固然一个以“文档分享的社区”性质的网站,其核心价值不在于如何产生优质的内容,而在于如何分享与交流,这一点上“豆丁网”做的不错。
虽然“豆丁网”类的网站不创造内容,但却是一个拥有大量会员的社区,从目标用户群来说,“盛大文学”是部分文艺青年及80、90一代的扎堆的地方,而“豆丁网”却是白领,学生等相对高端点的用户,我的论断没有实际的数据参考,有点想当然,希望不会对下面的分析造成偏差。
在什么情况下,会使用“豆丁网”,我们不妨看看“豆丁网”的资料来源,保留在用户电脑里面的可阅读文档,一般是用户觉得有价值才会保留,包括一个比较漂亮的PDF,比如某个学科的PPT,某篇有价值的论文,或是一本从网上download的比较完整的小说,几乎都是用户认为有价值的。这些资料文档,大部分是知识型的,在PC发展的这些年及在互联网大行其道之时,使得这些资料可以快速的在不同用户之间分享,的确使得人类获取资料的成本将至最低。
搜索引擎为什么得以成功,是因为搜索引擎已经成为了一个互联网的入口,“豆丁类”的网站,的确也是一个非常重要的知识入口,毕竟互联网时代,相对PC时代,还是年轻的,分享内容的时代与创造内容的时代更是年轻的,人类大量的知识都是以不同格式的文档存在的;因此可以“草率”的判断,“豆丁文档”的知识价值,远高于普通网页的价值,展示形式也比普通网页要丰富,对用户来讲门槛要低很多。
如果说有一个平台可以更方便,更直接,更有效的营销“非纯文学”类数字内容,从目标用户群来说,“盛大文学” 不及 “豆丁网”这类网站;盛大需要颠覆数字出版行业的生态环境,首先内容必须多元化,不仅仅是边缘化文学,同时在网上营销渠道上必须多元化,否则目标用户群体的不一致,会导致“非文学”用户的流失;从这点来看,盛大应该有一个类似“豆丁网”的知识分享平台。
结合文档分享平台,可以在线营销“收费的数字内容”,同时结合云端Bambook,使产业链更完整,类似“豆丁网”网站另外一个优势是,在当今已存在的数字化知识格式是多样化的,而“豆丁网”利用自己的FLASH阅读器,使得不同格式的内容,更加方便的浏览与传播,从某种角度看来,“豆丁网”也是一个平台。
下图是“盛大文学”与“豆丁网”的流量趋势图,可以看出“豆丁网”的用户及成长趋势比较明显,起点文学用户数量起伏很大,不探讨深层原因,只想说明“豆丁网”是一个比较成熟的 文档分享与传播的社区,用户量比较大。
维基百科是一个内容提供平台,和所有的网站不一样的是它是协同生产的,即人必须协调合作才能完成某件事,比单纯的共享难的多,但内容的质量却是所有网站中最高的,也是最权威的。维基百科的内容不属于任何人,任何人都可以免费获取内容,便于分享与传播,有多少博文引用链接来自于维基百科,维基百科的权威可见一斑。
对于云端产品Bambook来说如何方便的阅读维基百科这样高质量的内容也是非常有意义的事情,当然既能Bambook是基于android系统的,想必早已有人开发了app。维基百科的局限在于版权内容,从人类知识的发展来讲,那些赋予版权的内容,是不能在维基百科展现的,因此维基百科的知识很多时候更像是人类共有的一个知识体系库。
Bambook以人手一书作为“盛大人”的愿景,盛大的技术水平在国内毋庸质疑,能否解决内容平台的问题拭目以待……
从人类文明建立至今,一直在做知识的传递与分享这件事情,“结绳记事”也罢,“甲骨文”也罢,都是一种传递信息的介质与途径,人类掌握知识的目的无非是掌握事物的发展规律,消除人类自身的恐惧;对未来越无知,就越恐惧。
任何一个封闭的传播介质,没有足够开放的标准与服务,势必淘汰,因为很难做到知识的传承与快速分享。
“豆丁网”模式的网站及Google一直在做一件事情,就是知识的传承与分享;“豆丁网”能够通过自身的Flash阅读器阅读不同格式的文档,这就是在做传承,通过“豆丁网”的Flash分销机制可以在不同的网站分享内容,这就是在做分享;Google能索引所有网页的信息及几乎所有已存在格式的文档信息,这就是知识的传承,用户通过Google来搜索信息的内容,这就是知识的分享。以上两种分享方式其实都是被动式的,这种被动获取的信息的方式,会逐渐淘汰。
在谈我构思中的知识传承及传播介质之前,我们来看看国内两个文艺青年扎堆的地方,“起点文学”与“豆瓣网”,这两个网站都是基于社区交互驱动的。
“豆瓣网”从一个音乐、电影、书籍的分享社区转型至生活社区,暂不讨论转型的原因,我们来看看知识互动与知识的传承与创造关系,以往,任何传承内容的介质仅仅是从便携,易用的角度来升级的,介质本身与人是一对一的交流,群体交流的成本非常的高;在互联网知识时代,越来越多的是群体性交互,你可以通过留言、评论与不同的读者交流,甚至与作者交流,在这以往是不可想象的。
对Bambook这种终端来说,知识传承特性是很有重要的,无法方便阅读普通格式的文档,无法高效的组织知识及管理知识,这是不完美的;在未来电子书或是其他介质来讲,主要的竞争力是机器里面的软件,高效的传承、分享、交流;这些是一个完美终端介质要做的事情。
在微博上面,写了第一条,话越来越多,干脆贴过来 follow@ http://t.qq.com/paitoubing
有人一直意淫windows会不会没落,我的理解是,windows作为PC来讲,有太多人不希望他没落,基于windows的那些软件使得windows不太能没落,微软为什么坚持做自己的语言,其实是为了增加移植的难度,保护自己的壁垒,iphone和android之争也不过如此
iphone 从头至尾都是封闭的,Object-c;Android一个后起之秀要和大哥抢天下,选择了java作为app开发语言,j2me一直是N多手机游戏的开发首选,这样构造一个基于java的平台环境,当然会有很多拥护者,利用开源技术及优秀的设计,Android增长拭目以待
或许基于flash这个玩物,Adobe可以在任何一个平台游刃有余,可惜iphone这个变态就是不让flash有机会搞自己的平台,android当然会支持flash了,天下大乱才有机会嘛
盛大推出电子书bambook是必然的,盛大希望构造自己的app store,不仅仅是为了那些文字,还有SDO的游戏平台,未来终端设备重点是设备上的software,自己推出bambook就不用担心iphone这样的封闭变态,及推出自己的平台app store
bambook不知道主打的电子书还是app store,电子书真没有什么可做的,当作一个终端设备,完美的结合盛大游戏与盛大音乐、盛大视频可能会很有意思.
排头兵PHP中文分词类,主要作用是分析语料库,找出核心主题词,是网页相似度引擎的子模块
相比成熟的分词类库,如Lucene,中科院之流 没有任何优势,本类库是实验性项目,效率及算法[trie]并无特殊
暂时支持utf8编码
线上测试版即将出来 http://www.paitoubing.cn/pdb/paiswc.php
ps:我的博客托管服务器,暂时不能访问外网,没法安装apc扩展……..
先贴上切词函数,目前只能识别数据字典的词条分词,其他方面的可以扩展.
Trie数据字典保存在apc共享缓存中,根据词条首字母$key 序列化$value 了trie子树,序列化的效率真他妈低,影响了整体分词的效率
$result =''; function pai_scw($text="") { global $result; $textlen = mb_strlen($text); $trienode = false; $find = array(); $wordrootposition = 0;//词根位置 $prenode = false; $word = ''; for ($i = 0; $i < $textlen;$i++) { $character = mb_substr($text,$i,1); $success = false; if(empty($word)) { $trienode = unserialize(apc_fetch($character,$success)); //unserialize 效率低 //当$character 没有一个可以匹配的字符时,直接跳过,不做倒退匹配 if(!$success) { continue; $result = $result.$character; } } //匹配词首 if($success) { $word = $word .$character; continue; } if(isset($trienode['c'][$character])) { $word = $word .$character; // echo "isset".$word."\n"; $trienode = $trienode['c'][$character]; if($prenode == 0) { $wordrootposition = $i; } $prenode = true; if($trienode['w']) { $find[] = array('position'=>$wordrootposition,'word' =>$word); $result = $result."-".$word."-"; } } else { /*@example 词条:北京奥委会 *@example 判断分词:北京 奥运 *@example 应该回溯到位置 奥的位置 */ $i = $i - mb_strlen($word); $prenode = false; $word = ''; //添加分词结果 $result = $result.$character; } } return $find; }