为什么???为什么我们的gov要封wiki,连一点余地都没有!!
分类: 教育/科学 >> 科学技术
解析:
维客中国(wiki)关闭,远离是非
原文:fxdbokee/
维客中国(wiki)的前身是搜派(sopai/),主要是由教育网的几个学生业余时间发起建设的。后来,寻求我们提供一些赞助。我和卢亮一直认为,博客网除了商业化外,一定需要积极参与和支持一些公益性的项目。因此,我们特地申请购买了教育网的带宽,架设了服务器。这完全是出于公益性的目的,也是为大家提供一个新的选择。我们反复向发起者确认过网站内容没有侵权的内容。
维客中国开通之日,就承受了各方面的压力,我们努力做了一些沟通。根本出发点是希望知识共享的精神能够在中国互联网不断发扬光大。但是,由于各种原因,从第一天开始,维客中国遭遇各种猜疑和攻击,今天开始,遭遇大量内容的删除,灌入大量反动和**的内容,以及以维基社区名义的各种漫骂和诽谤。作为一个完全公益性、开放式的应用,对于维客中国网友编辑的每个词条,我们无力一一检验每一个词条版权的严谨性(希望有版权问题的地方,能通过正常方式和渠道进行具体指出,按照基本规则沟通和解决,包括诉诸法律)。也没有精力答复和应对各种恶意的、完全是莫须有的猜度。我们无意冒犯维基社区,也无力抵挡各种网络攻击和破坏,无力继续提供正常的访问和服务。因此,决定就此关闭。
维客中国从10月20日开通,到今天活了不到10天时间。如果它的死能够给一些人带来慰籍和快乐,那已经是死得其所!只希望你们的快乐能够给中国互联网的未来多一份贡献。生存和死亡,善与恶,高尚和卑鄙,在互联网本来就可能是一线之隔。有人攻击得高尚,有的死得光荣,但维客中国的死仅仅是希望获得一份基本的清静。
我们不想介入更多的是非,希望可以安静、专心做自己的事情。各种恶意的攻击和猜度我们也不想多解释。希望维客中国10天生命的死亡,已经可以给大家一个最终的解决。真诚希望维基社区能更加繁荣!
华尔街日报:维基百科部分内容在中国可以访问
在经过近一年的封锁后,中国互联网监管部门基本恢复了维基百科(Wikipedia)英文网站的访问维基百科是由读者编辑的网上百科全书
但这种变化可能只是说明中国的网上内容审查已找到了更精确地过滤内容的方法,也就是按照网页封锁网上内容,而不必禁止访问整个网站此外,维基百科的中文网站仍然不能访问
负责出版维基百科的非营利组织维基百科基金会(Wikimedia Foundation)的发言人迈克尔•斯诺(Michael Snow)说,部分解禁应有助于向这部网上百科全书提供更多的内容
斯诺说,尽管还有封锁,但已可访问部分内容,不过在我们看来,能够公开访问该网站会更好我们希望能够完全开放,让中文维基百科也能够自由访问
维基百科的中文网站共有约90,000篇文章,而英文维基百科则有140多万个条目
维基百科称,该基金会一直在与中国私下接触了解封锁的原因以及如何能够解除封锁不过,政府对此事很少表态维基百科在中国的内容提供者也在游说互联网服务提供商向他们透露更多信息
Danweiorg的编辑杰里米•戈德考恩(Jeremy Goldkorn)说,解禁可能意味着政府总体政策的改变Danweiorg是一个有关中国媒体和广告的网站
他说,正在做出的一些决定改变了封锁网站的趋势,这是积极的变化
维基百科最近一次遭到封锁是从2005年10月开始,这也是历次封锁中最长的一次封锁从不正式宣布,网民和研究人员只是私下猜测个中原因有人认为是一篇有关中国反腐败示威的文章激怒了审查者
专家认为,中国有关部门采取了一种叫做"分组丢弃机制"(packet-dropping scheme)的方法阻止访问维基百科在Alexa Internet Inc的网络流量排名中,维基百科位居第十五位
维基百科系统管理员蒂姆•斯塔林(Tim Starling)说,现在看来中国正在使用不同的内容过滤方法网站的一些内容可以访问,而一些用中文撰写的网页和同中国有关的内容则无法访问
维基百科中国用户Hector Lee说,能让中国人更多地了解各种信息,让他们自己判断对错是一件好事
戈德考恩说,他乐观地认为,这次解除封锁的做法并不是权宜之计他说,看来这次有关方面在封锁哪些内容、不封锁哪些内容的问题上动了些脑筋
把doc文档上传到其它可以访问的网络U盘之类的地方,然后在wiki里面引用那边上传后保存的文档链接。
可以将doc文档按页拆分保存成多张再依次上传。
在文件include/DefaultSettingsphp中修改就可以了:$wgFileExtensions = array( 'png', 'gif', 'jpg', 'jpeg', 'doc', 'pdf' ); #新增doc和pdf,表示支持上传的文件类型。
不是
Wiki一词来源于夏威夷语的“wee kee wee kee”, 发音wiki, 原本是“快点快点”的意思,被译为“维基”或“维客”。一种多人协作的写作工具。Wiki站点可以有多人(甚至任何访问者)维护,每个人都可以发表自己的意见,或者对共同的主题进行扩展或者探讨。Wiki也指一种超文本系统。这种超文本系统支持面向社群的协作式写作,同时也包括一组支持这种写作。
简介编辑
有人认为,Wiki系统属于一种人类知识网格系统,可以在Web的基础上对Wiki文本进行浏览、创
维基应用的典范,维基百科
建、更改,而且创建、更改、发布的代价远比HTML文本小;同时Wiki系统还支持面向社群的协作式写作,为协作式写作提供必要帮助;最后,Wiki的写作者自然构成了一个社群,Wiki系统为这个社群提供简单的交流工具。与其它超文本系统相比,Wiki有使用方便及开放的特点,所以Wiki系统可以帮助我们在一个社群内共享某领域的知识。
由于WiKi可以调动最广大的网民的群体智慧参与网络创造和互动,它是web20的一种典型应用,是知识社会条件下创新20的一种典型形式。它也为教师和学生的知识共享提供了高效的平台,实现了快速广泛的信息整合。
Wiki的架构
GeoDNS
这个GeoDNS可能比较新奇,实际上原理很简单,GeoDNS是一个为BIND写的40行的小程序,可以让DNS解析的时候考虑地域因素——让用户能够访问离他地域最近的Web服务器。
LVS
LVS 是一个开源的软件,可以实现 Linux平台下的简单负载均衡。主要由负载调度器、服务器池和共享存储构成。可喜的是,这是一款为数不多的中国人自己编写的开源软件(章文嵩发起);可惜的是,LVS目前仅支持Linux。
Squid
Squid大家可能都比较熟悉,Squid是一种用来缓冲Internet数据的软件。尤其适合像维基这样的遍布全球,数据中心却很集中的站点使用。在维基中,Squid缓存分为两组,一组是文档内容(多为压缩的HTML页面),另一组为媒体内容,主要包括等大一点的静态文件。目前总计有55台Squid服务器在维基运行,维基正在准备添加另外的20台。根据维基披露的资料,其中每一台服务器每秒要处理1000~2500 个http请求,每台服务器承受100Mb/s~250Mb/s的流量,每台服务器负责14~32万个连接,每台Squid服务器分配出40GB作为缓存空间。硬件方面,这些Squid服务器每台都有4块硬盘,8GB内存。
维基媒体平台
维基所有的项目都运行在维基媒体平台上,这是一个遵守GPL的开源软件,以PHP写成。维基本身在使用,但很多别的机构也使用了该软件平台。在所有125台应用服务器上都安装了维基媒体平台,还有40台应用服务器马上就要上线,这些应用服务器都采用了两颗四核的CPU。这些媒体平台都由一个中心控制台控制,维基可以通过该平台部署某个应用到数百台机器上,非常方便。维基媒体平台非常注重缓存,多数缓存都放在Memcached中。
CDN
维基在美国、荷兰和韩国分别设有群集,维基CDN会根据来访IP位置的不同选择指向最近的群集。
数据存储
元数据,比如文章修改历史,文章的链接和用户资料等内容被存放于主数据库;正文存于外部存储;用户上传的等信息则单独存放于服务器。
主数据库服务器一共有15台,配置为内存4GB~16GB,6块73~146GB的硬盘和双CPU。数据库中除了有一个主数据库,还有许多复制的从数据库,这些主从数据库并不是按照服务器个数来划分的,数据库都是跨服务器运行的。
编写编辑
MediaWikisyntax
Equivalent HTML
Rendered output
"Take some more [[tea]]," the March Hare said to Alice, very earnestly
"I've had '''nothing''' yet," Alice replied in an offended tone, "so I can't take more"
"You mean you can't take ''less''" said the Hatter "It's very easy to take ''more'' than nothing" <p>"Take some more <a href="/wiki/Tea" title="Tea">tea</a>," the March Hare said to Alice, very earnestly</p>
<p>"I've had <b>nothing</b> yet," Alice replied in an offended tone, "so I can't take more"</p>
<p>"You mean you can't take <i>less</i>" said the Hatter "It's very easy to take <i>more</i> than nothing"</p>
"Take some moretea," the March Hare said to Alice, very earnestly
"I've hadnothingyet," Alice replied in an offended tone, "so I can't take more"
"You mean you can't takeless" said the Hatter "It's very easy to takemorethan nothing"
历史编辑
Wiki软件是由软件设计模式社区发展出来,用来书写与讨论模式语言。沃德·坎宁安于1995年3月25日成立
檀香山的Wiki Wiki站牌
了第一个Wiki网站:WikiWikiWeb,用来补充他自己经营的软件设计模式网站。他发明了Wiki这个名字以及相关概念,并且实现了第一个Wiki引擎。坎宁安说自己是根据檀香山的Wiki Wiki公车取名的。这是他到檀香山学会的第一个夏威夷语。
坎宁安说Wiki的构想是来自他自己在1980年代晚期利用苹果电脑HyperCard程序作出的一个小功能。
HyperCard类似名片整理程序,可用来纪录人物与相关事物。HyperCard管理许多称为“卡片”的数据,每张卡片上都可划分字段、加上、有样式的文字或按钮等等,而且这些内容都可在查阅卡片的同时编辑修改。HyperCard类似于后来的网页,但是缺乏一些重要特征。
坎宁安认为原本的HyperCard程序很有用,但创造卡片与卡片之间的链接却很困难。于是他不用HyperCard
WIKI-WIKI巴士
程序原本的创造链接功能,而改用“随选搜索”的方式自己增添了一个新的链接功能。用户只要将链接输入卡片上的一个特殊字段,而这个字段每一行都有一个按钮。按下按钮时如果卡片已经存在,按钮就会带用户去那张卡片,否则就发出哔声,而继续压着按钮不放,程序就会为用户产生一张卡片。
坎宁安将这个程序与他自己写的人事卡片展示给许多朋友看,往往会有人指出卡片之中的内容不太对,而他们也可以当场利用HyperCard初始的功能修正内容,以及利用坎宁安加入的新功能补充链接。
坎宁安后来在别处又写了这样的功能,而且这次他还增加了多用户写作功能。新功能之一是程序会在每一次任何一张卡片被更改时,自动在“最近更改”卡片上增加一个连往被更改卡片的链接。坎宁安自己常常看“最近更改”卡片,而且还会注意到空白的说明字段会让他想要描述一下更改的摘要。
特点编辑
WiKi是一个供多人协同写作的系统。与博客、论坛等常见系统相比,WiKi有以下特点:
使用方便
维护快速:快速创建、更改网站各个页面内容。
格式简单:基础内容通过文本编辑方式就可以完成,使用少量简单的控制符还可以加强文章显示效果。
链接方便:通过简单的“[[条目名称]]”,可以直接产生内部链接。外部链接的引用也很方便。
自组织
自组织的:同页面的内容一样,整个超文本的相互关联关系也可以不断修改、优化。
可汇聚的:系统内多个内容重复的页面可以被汇聚于其中的某个,相应的链接结构也随之改变。
可增长
可增长:页面的链接目标可以尚未存在,通过点选链结,我们可以创建这些页面,使系统得以增长。
修订历史:记录页面的修订历史,页面的各个版本都可以被取得。
开放性
开放的:社群内的成员可以任意创建、修改、或删除页面。
可观察:系统内页面的变动可以被来访者清楚观察得到。
WiKi支持面向社群的协作式写作,同时也包括一组支持这种写作的辅助工具。有人认为,Wiki系统属于一种人类知识的网络系统,我们可以在Web的基础上对Wiki文本进行浏览、创建、更改,而且这种创建、更改、及发布的代价远比HTML文本小;与此同时Wiki系统还支持那些面向社群的协作式写作,为协作式写作提供了必要的帮助;最后,Wiki的写作者自然构成了一个社群,Wiki系统为这个社群提供了简单的交流工具。与其它超文本系统相比,Wiki有使用简便且开放的优点,所以Wiki系统可以帮助我们在一个社群内共享某个领域的知识。
由于Wiki的自主性,可增长以及可观察的特点,使Wiki本身也成为一个网络研究的对象。对Wiki的研究也许能够让人们对网络的认识更加深入。
另外因为WiKi是一个群体协作的平台,所以它还有平等、共享的特点。
应用编辑
WiKi在一些需要内容管理系统的企业中得到了广泛应用。JotSpot和SocialText是创WiKi企业应用的先河。
WiKi可以在高校教育环境中发挥积极的作用。直到2006年,WiKi教育应用在目前来讲,全球应用的案例都比较少。
WiKi除了被用来创建网站外,也被用作编写网志。 WiKi在中小学教育方面,可以作为学生协助学习的平台。
区别编辑
举例说明,Wiki网站的应用:
维基Wiki站点一般都有着一个严格的共同关注,Wiki的主题一般是明确的坚定的,Wiki站点的内容要求
可视化Wiki
着高度相关性。对其确定的主旨,任何写作者和参与者都应当严肃地遵从。Wiki的协作是针对同一主题作外延式和内涵式的扩展,将同一个问题谈得很充分很深入。博客Blog是一个简易便捷地发布自己的心得,关注个性问题的展示与交流的综合性平台。一般的Blog站点都会有一个主题,但是这个主旨往往都是很松散的,而且一般不会去刻意地控制内容的相关性。
Wiki非常适合于做一种 “All about something”的站点。个性化在这里不是最重要的,信息的完整性和充分性以及权威性才是真正的目标。Wiki由于其技术实现和含义的交织和复杂性,如果你漫无主题地去发挥,最终连建立者自己都会很快的迷失。 Blog注重的是个人的思想(不管多么不成熟,多么地匪夷所思),个性化是Blog的最重要特色。Blog注重交流,一般是小范围的交流,通过访问者对一些或者一篇Blog文章的评论和交互。
Wiki使用最多也最合适的就是去共同进行文档的写作或者文章/书籍的写作。特别是技术相关的(尤以程序开发相关的)FAQ,更多的也是更合适地以Wiki来展现。 Blog也有协作的意思,但是协作一般是指多人维护,而维护者之间可能着力于完全不同的内容。这种协作在内容而言是比较松散的。任何人,任何主体的站点,你都可以以Blog方式展示,都有它的生机和活力。从目前的情况看,Wiki的运用程度不如Blog的广,但以后会怎样,还有待观察,毕竟Wiki是一个共享社区。
Blog可以展示自己个性化的东西,Wiki则体现共性的东西。
技术规范编辑
CAOWIKIpedia
Wiki的技术和规范 WiKi是任何人都可以编辑的网页。在每个正常显示的页面下面都有一个编辑按钮,点击这个按钮你就可以编辑页面了。有些人要问:任何人都可以编辑?那不是乱套了么?其实不然,WiKi体现了一种哲学思想:“人之初,性本善”。WiKi认为不会有人故意破坏WiKi网站,大家来编辑网页是为了共同参与。虽然如此,还是不免有很多好奇者无意中更改了WiKi网站的内容,那么为了维持网站的正确性,WiKi在技术上和运行规则上做了一些规范,做到既持面向大众公开参与的原则又尽量降低众多参与者带来的风险。这些技术和规范包括:
1、保留网页每一次更动的版本:即使参与者将整个页面删掉,管理者也会很方便地从纪录中恢复最正确的页面版本。
2、页面锁定:一些主要页面可以用锁定技术将内容锁定,外人就不可再编辑了。
3、版本对比:WiKi站点的每个页面都有更新纪录,任意两个版本之间都可以进行对比,WiKi会自动找出他们的差别。
4、更新描述:你在更新一个页面的时候可以在描述栏中写上几句话,如你更新内容的依据、或是跟管理员的对话等。这样,管理员就知道你更新页面的情况。
5、IP禁止:尽管WiKi倡导“人之初,性本善”,人人都可参与,但破坏者、恶作剧者总是存在的,WiKi有记录和封存IP的功能,将破坏者的IP记录下来他就不能再胡作非为了。
6、Sand Box(沙箱)测试:一般的WiKi都建有一个Sand Box的页面,这个页面就是让初次参与的人先到Sand Box页面做测试,Sand Box与普通页面是一样的,这里你可以任意涂鸦、随意测试。
7、编辑规则:任何一个开放的WiKi都有一个编辑规则,上面写明了大家建设维护WiKi站点的规则。没有规矩不成方圆的道理任何地方都是适用的。
扩展阅读编辑
不要混淆“维客”
维客WiKi和威客witkey在发音上相似,不少人士混淆与两个概念并产生误解。
维客WiKi以人的自豪和自我体现为动力,把人类已有的杂乱信息和数据结构化形成可免费共享的知识,所以维客WiKi占据了知识的共享区;
威客witkey承认人的知识,智慧和能力具有价值,通过知识的价值化促进人们使用自己的智慧参与解决问题,并形成结构化的有价值知识区,所以威客占据了智慧和知识的一部分领域。
维客的问题
无数的互联网用户为维基百科贡献了智力劳动,无私的贡献导致维基的管理者不能随意的用其牟利,这就是维基的困境,虽然维客提出了维基经济学,但由于其没有意识到知识的价值化,所以维基也就没有商品的概念,用经济学描述维基可以看作是一次炒作和混淆视听的行为。
到2008年1月9日本文写作时,维基的创始者们仍然没有了解维客WiKi的起源和发展方向,这一点需要用威客理论来解答:
维客WiKi起源于BBS的帖子修改权,传统只有发布者和网站管理员可以修改帖子的内容,当一个帖子所有的浏览者(相对)都能参与修改时,维客诞生了。
X Window系统(也常称为X11或X)是一种以位图方式显示的软体视窗系统。最初是1984年麻省理工学院的研究,之后变成UNIX、类UNIX、以及OpenVMS等操作系统所一致适用的标准化软体工具套件及显示架构的运作协定。X Window系统透过软体工具及架构协定来建立作业系统所用的图形用户界面,此后则逐渐扩展适用到各形各色的其他作业系统上。现在几乎所有的作业系统都能支援与使用X。更重要的是,今日知名的桌面环境——GNOME和KDE也都是以X Window系统为基础建构成的。 由于X只是工具套件及架构规范,本身并无实际参与运作的实体,所以必须有人依据此标准进行开发撰写。如此才有真正可用、可执行的实体,此可称为实现体。目前依据X的规范架构所开发撰写成的实现体中,以XOrg最为普遍且最受欢迎。XOrg所用的协定版本,X11,是在1987年9月所发布。而今最新的参考实作(参考性、示范性的实作体)版本则是X11 Release 71(简称:X11R71),而此专案由XOrg基金会所领导,且在MIT授权和相似的授权许可下是自由软体。[1] X客户端/服务器模式和网络透明性 主条目:X Window系统的协议和架构 X能为GUI环境提供基本的框架:在屏幕上描绘、呈现图像与移动程式视窗,同时也受理、执行、及管理电脑与滑鼠、键盘的互动程序。不过,X并没有管辖到使用者介面的部份,而是由其他以X为基础的实现体来负责,也因为如此,以X为基础环境所开发成的视觉样式非常地多;不同的程式可能有截然不同的介面呈现。 X采行客户端-服务器的架构模型,由一个X服务器与多个X客户端程序进行通讯,服务器接受对于图形输出(窗口)的请求并反馈用户输入(键盘、鼠标、触摸屏),服务器可能是一个能显示到其他显示系统的应用程序,也可能是控制某个PC的视频输出的系统程序,也可能是个特殊硬件。 X的一大特点在于“网路透明性”[2]:应用程式(“客户端”应用程式)所执行的机器,不一定是使用者本地的机器(显示的“伺服器”)。X中所提及的“客户端”和“伺服器”等字眼用词也经常与人们一般想定的相反,“伺服器”反而是在使用者本地端的自有机器上执行,而非是在远端的另一部机器上执行。 参考:uploadwikimedia/ /mons/9/9e/X_client_server_example 在图例中,X伺服器从键盘、滑鼠端取得输入资讯,之后将输入反馈显示于银幕,而网页浏览器及终端机模拟器则在用户端的本机系统上执行。此外用户端也透过网路与远端的机器、伺服器保持联系,以保讯息状态的更新。如此的机制及架构能使远端执行的软体如同在本机端执行一样。 服务器和客户端之间的通信协议的运作对计算机网络是透明的: 客户端和服务器可以在同一台计算机上,也可以不是
或许其架构和操作系统也不同,但都能运行。客户机和服务器还能够使用安全连接上在互联网上安全地通讯。 为了使远端客户程序显示到本地服务器,用户一般需要启动一个终端窗口和到达远端计算机的tel或者ssh,令其显示到用户计算机,(例如:在运行bash的远端计算机上export DISPLAY=[用户的计算机]:0)然后启动客户端。 然后客户端就会连接到本地计算机,并且远端应用程序会显示到本地屏幕并被本地输入设备所控制。与之对应,本地计算机上也可以执行一个连接到远端计算机的小型代理程序,并在该端启动与运行自有需求与指定的应用程序。 实际的远端客户端的例子有:图形化管理远程计算机;在远端UNIX计算机上运行计算密集的仿真程序并把结果显示到本地的Windows桌面计算机;用一套显示器、键盘和鼠标控制同时运行在多台计算机上的图形化软件。 X的设计原则 X的设计原则早在最初仍在麻省理工学院的阶段(1984年)就已经成形,由Bob Scheifler和Jim Gettys两人制订出X最早的开发、强化、改进原则,原则大体如下: 除非没有它就无法完成一个真正完整的应用程式,否则不用增加新的功能。 决定一个系统不是什么和决定它是什么同样重要。与其去适应整个世界的需要,宁可使得系统可以扩展,如此才能以持续相容的方式来满足新增需求 只有完全没实例时,才会比只有一个实例来的糟。 如果问题没完全弄懂,最好不要去解决它[3] 如果预期要用90%的努力去完成10%的工作,应该用更简单的办法解决。(参见:更糟就是更好。) 尽量避免复杂性。 提供机制而不是策略,有关使用者介面的开发实现交给实际应用者自主。 之后,上述原则中的第一项原则在设计X11时被加以修改,修订成:「除非已有真正的应用程式真的需要X为其修订、增订等支援,否则不会为X增加新功能。」X基本上一直遵循这些原则,参考实现的扩展及改进也是以此原则的角度来着手,也因为奉行上述原则,使至今的最新版X仍能与最初(1987年)发布的协定标准近乎完全相容。 zh /wiki/X_Window%E7%B3%BB%E7%BB%9F
参考: zh /wiki/X_Window%E7%B3%BB%E7%BB%9F
得到了虚名,失去了大义,何必?
得到了虚名,失去了大义,何必?
得到了虚名,失去了大义,何必?
得到了虚名,失去了大义,何必?
得到了虚名,失去了大义,何必?
得到了虚名,失去了大义,何必?
得到了虚名,失去了大义,何必?
得到了虚名,失去了大义,何必?
得到了虚名,失去了大义,何必?
得到了虚名,失去了大义,何必?
简单步骤分步阅读
1
/3
下载 WikiTaxi 和离线维基百科数据库
在你使用 WikiTaxi 之前,必须先下载它和维基百科的离线数据库,我们提供了简化版的英文版、完整英文版和中文版的维基数据库供大家下载,下载链接位于文章结尾处,请根据自己的需求选择下载。不过数据比较大,并且服务器位于国外,速度有点不尽人意,只能有点耐心吧。
2
/3
导入维基数据库到 WikiTaxi
因为维基百科提供的离线数据库(xmlbz2)文件格式 WikiText 并不能直接使用,所以我们需要先将数据库转换成 WikiTaxi 的 taxi 格式。下载解压 WikiTaxi 之后你可以看到一个 WikiTaxi_Importerexe 的文件,双击运行它。简单来说,它就是一个转换数据库格式的工具。使用方法和简单,第一项选择 xmlbz2 文件,第二项选择要保存转换好的taxi文件,然后按 Import Now 即可开始。中间那个横条是用来调整分配多少内存给该工具来进行转换工作,当然能用的内存越多,转换速度也就也快了。转换好之后,如没特别需要,之前那个xmlbz2的文件你可以删除掉了。
3
/3
运行 WikiTaxi
如果你已经制作好taxi数据库之后,那么双击运行 wikitaxiexe ,在菜单里选择 “Options”-> “Open taxi Database”来打开刚才那个制作好的taxi数据库文件即可。然后,就没然后了,你现在已经拥有一个离线的维基百科数据库了!想查询什么直接搜索就行了。
使用方法
1
/2
WikiTaxi首先需要Wikipedia的数据文件,比如在这里可以下载英文版本的备份导出文件:
http://dumpswikimediaorg/enwiki/
一般选择pages-articlesxmlbz2,20100916的备份导出文件已经达到了61G。
下载之后,运行WikiTaxi_Importerexe,将该数据文件转换提取成自己的数据库格式文件taxi,通常设置更多的内存,会提高转换提取的速度,这个过程可能会有几十分钟以上。WikiTaxi转换提取后的数据库约为107G。
2
/2
转换提取完成后,运行WikiTaxiexe, 打开数据库文件,即可开始离线浏览、搜索Wikipedia了,默认是随机挑选的页面。在数据库转换提取正确的情况下,就可以删除Wikipedia备份导出文件了。如果希望运行时自动加载数据库文件,可以创建使用命令行参数方式,
推荐使用mediawiki,资料附后。wiki建站专题站点可访问天下维客 wwwallwikicom ,有中文的wiki建站综述、具体过程、相关技术资料以及其他各种wiki程序的介绍等。
下面是节选的mediawiki资料:
MediaWiki全球最著名的开源wiki引擎,运行于PHP+MySQL环境。从2002年2月25日被作为维基百科全书的系统软件,并有大量其他应用实例。目前MediaWiki的开发得到维基媒体基金会的支持。
MeidaWiki一直保值着持续更新,当前最新版本为1413(2006-1-5)和157(2006-3-2)稳定版本。MediaWiki的原作者为德国的Magnus Manske。
目录 [隐藏]
1 为什么要选择mediawiki来做wiki网站?
11 mediawiki的弱点
12 mediawiki系统特色
2 使用提示
3 版本
4 参考资料
41 下载网址
[编辑]为什么要选择mediawiki来做wiki网站?
经受过重量级应用的考验,功能丰富却架设简单。
全世界最大的wiki项目维基百科是使用mediawiki的成功范例,数据量、访问量都超级庞大
mediawiki的功能非常丰富,支持多语言版本,充分满足知识站点的需要
运行环境要求很低,架设过程简洁,即使新手也可以迅速建立自己的站点
最大的wiki程序社区:
mediawiki是目前应用最广的wiki程序,数以万计的网站在使用它,很容易找到范例站点
有大量的热心参与人员参与研究,资料多,容易找到互相交流的朋友。例如QQ群3680101(技术群)。
持续开发,程序特性功能不断完善,保证未来的支持
mediawiki是受到维基媒体基金会支持的开源项目,在功能、性能、安全方面将不断优化
[编辑]mediawiki的弱点
后台管理功能不是很完善,仅通过简单的特殊页面完成这些功能。
一般环境下,mediawiki的运行速度相对其他wiki程序要差很多。mediawiki的目标是为维基媒体项目服务,很多华丽的性能特征要在高端设备环境(多服务器,多数据库,反向缓冲squid服务器阵列,大量额外的PHP缓冲引擎)中才能体现。(参见[1])
在界面方面关注不够,导致外观美化的修改繁琐,甚至需要一定的技术背景
wiki引擎
wiki引擎主条目
wiki引擎的流行度
常见中文wiki引擎:
MediaWiki是最流行的Wiki引擎,支持多语种。用它做的网站数以十万计。
MoinMoin平实稳重,支持中文和多语种,插件丰富。Python环境。
PmWiki:无需数据库的小巧程序。架设简单,权限控制、插件扩展都不错。PHP环境。
TiddlyWiki:用javascript写成精巧程序。单一文件,但有出色的动态效果。
TWiki:基于Perl的企业级协作平台
CooCooWakka:早期的小型中文wiki引擎
[编辑]mediawiki系统特色
wiki的重要特征
记录所有的改动版本,能方便的查阅历史更新记录,这使得开放性编辑成为可能
自动产生链接,编辑文本中中括号中的内容(如“[[X条目]]”)将自动产生链接
允许使用模板,方便对相同内容的重复使用、更新
支持分类,并根据分类在不同的文章之间自动产生关联
允许每个用户自行选择系统外观
[编辑]使用提示
MediaWiki的站点架设问题请见mediawiki建站。
维基百科这几年来一直是断断续续的,并不是说这个网站的问题,而是被国内封闭(屏蔽了)
主要的原因是,里面有些知识内容是反动 或者不被中国政府接受的。
这个请你理解我的话的意思,我也不能说太多
你要访问,只能通过代理服务器访问
0条评论