星期六, 六月 05, 2004
ooof |
CNBlog:Blog On Blog
vanvan |
网志分类标准初想
借图书馆学的平台张看,可见两大类分法:一种以字母起首指代类别,如中图分类法。另一种只用数字,为欧美图书馆常用。utf码、trackback与翻译网站的广泛应用,使blogosphere中语言的边界愈加模糊,也就是说,人们已可摸索着找出巴别塔的楼梯口(业师Prof. Dr. Soesemann,德国传播史巨擎,认定,只要某人能逐字逐句断断续续拼凑着读出一篇短文章,我们即可以认为他已具阅读能力)--那么,比起字母/词语,数字类目无疑更为适用。
数字分类法的开山之作Dewey Decimal Classification(简称DDC),采取十进制数码来安置类别:10个基本大类,从000-900,分别是
000 信息学
100 哲学与心理学
200 宗教
300 社会科学
400 语言学
500 自然科学与数学
600 技术与医学
700 艺术
800 文学
900 历史与地理学。
在每个大类下,再在十位分类,举个例子:300大类(社会科学)下,310指统计学,320指政治学,330指经济学。。。一直分类到390。第三步,在个位数继续细分,例如上文提到的政治学(320),到这一步分为321(国家与地区体制)、322(国家与社团关系)、323(公民政治权利)。。。
那么,一本书的内容,用三位数已能基本标明。
事实上,一本书的内容,很可能是跨学科的。有时候,我们更需要从编码获知这本书的其他信息,比方说,这本书是用什么语言写成的,诸如此类。以DDC为基础,比利时人Paul Otlet提出的Universal Decimal Classification(简称UDC)就派上用场了。UDC是在DDC的数字编码上添加少量符号(比如用“+”号连结两个百位数,表明其涉及的两个或以上学科。又比如用“=”标示语言)。
图书馆分类法科普完毕。现在我可以开始设想UDC怎么应用到blogs分类上了。
网志既能以“博”犹之,内容繁杂,不可斗量。所以,我的初步设想,只好亦比UDC更繁一步,姑且称作VDC设想。
袭用DDC的分法,即000-900分别指代10个学科。初分,应该在创作及发表这个网志时完成。BSP可以规定,新申请的网志须在这10个基本大类中挂靠一个。比如一位职业厨师,他为个人网志设的主题可能是技术与医学类(600)下的烹饪类(640),即得到640的首码。一位记者的网志主题若与他的职业相关,则编为信息学(000)下的新闻类(070)。
然后,网志作者创作的每一篇网志,均得到一串或长或短的编码。后面这组编码与前一组以“.”分隔。并且,由于每一篇网志的内容有可能涉及各个学科,因此,借UDC的法子,用“+”号连结这组编码。
第三组编码,作为备注,用UDC各种符号及数码标示。如“=20”表示这篇网志是用英语写就。
整体如图:

完整编码怎么用呢?我们看到,厨师在网志里写菜谱(编码:640.640),含有两个指代烹饪的代码,所以与烹饪的相关度也大--在blogs目录中烹饪类下,这一篇“640.640”也就应该排得比较前。像记者用英语写“出差到北京,抱怨塞车”的一篇(编码:070.389+915=20),有可能在新闻类(070)、道路交通类(389)、亚洲地理及旅行(915)以及英语网志(=20)中出现。
与图书馆学人J谈这个设想,他认为分类应该由BSP完成,因为“一本书不可能决定自己的类别,最终是由图书馆分类的”。而我主业为传播学,则认为blogger属于传播过程基本三要素之communicator,因而掌握主动分类权。
网志作者在发表网志时主动分类,这是理想情况。很多人却没有这样做,或是因为懒,又或是因为并不了解类别,根本不知道自己随手所写的该分到哪儿去。那么,他的每一篇未作主动分类的网志,便只能在申请网志时设定的类别的目录下显示出来了。
网志作者懒惰,BSP有没有可能替他们勤快一下呢?有没有技术上的可能,在网志发表之际,即自动scan网志语句,像传统的搜索引擎一样,根据某些词语出现的频率、超链接名称等等,将这篇网志自动分类?错分固然避免不了,但也有弥补的方法:此后再自动统计影响因子,重新分类。
在下不揣敝陋,抛砖引玉。上述标准初想固然不完善,只图就此话题,引出各背景人士远虑深谋。
若BSP们坐下来开联席会议,商定一套统一的分类标准,对blogs信息整理无疑意义深远,与RSS搜索可互为补充,互作参照。
(原发于:http://vanvan.20six.de/archive/2004/06/05/1d2pi33vbovgw.htm)
星期五, 六月 04, 2004
horse |
被大容量彻底击败!
Eric Nash |
狗狗博客,厨师上阵
不过厨师确实重要,中国软件做不好,原因可能就在于缺好厨师,coder个个面黄肌瘦的;好午饭能够使工程师下午的工作精神提高20%,不管是不是真的,CEO必须相信这个,这个叫做厨房就是生产力。
shizhao |
中文维基百科被封锁?
中文维基百科从今天上午10点多起无法访问。维基百科上最后一次大陆网友(IP查询)的编辑是在15:12。但是其他wikipedia访问都正常,mountain怀疑被中国政府封锁,我也无法访问中文版。
最令人担心的事情终于发生了...,看来很可能是被封锁了。不知道是不是最近外电的报道,还是一些台湾人在这里写的一些与台独有关的文章和讨论引起的?或者是由于“6?4”临近,暂时性的(这样的话,还好)?
如果真是这样,谁能告诉我解决的办法?应该向政府的什么部门提出?
希望看到这篇文章的维基参与者请暂时到中文维基词典进行讨论。(这里没有封锁)啤酒馆 - 茶室
也请关注wikipedia的朋友和大家帮助我们!谢谢!!
另外,为了确证,请各地维基参与者确认一下是否能够访问wikipedia。
随时记录:
mountain-北京,教育网无法访问
shizhao-北京,科研网无法访问
topku-15:31:广州 ADSL 可以访问
isaac、Jamguo-16:00 上海,专线,不能访问。16:50可以访问
liyan- 16:00 上海公众网,拨号可以访问
备注:似乎只有科研网和教育网不能访问
ooof |
CNBlog:Blog On Blog
这样做,需要对词条做基础的分类,再根据不同的类设定不同相关的字段名,复杂内容需要其它的表来支持。
然后写字典者,根据词条不同的字段做相应内容的填写(一些写字典者当时没有意识到的内容也可以先行发现)。
这样,将可以得到一个更系统的字典。
后来想到,是不是可以不通过数据库的方式,用xml来代替库,以更简单、通用实现。
Tian |
两岸同文
越来越觉得,这样的安排,甚有益处:两岸的语文,相互启发。若不是有这个网志,我也不知道comment可以译成“回响”;要不是有那个,我也不知道archives可以说成“存档”(第一次听到,还以为是“save”,楞没反应过来)。
英文:archives, comment,enty;
台湾地区译法:汇整,回响,文章;
中国大陆译法:存档,评论,条目;
我喜欢的译法:档案,回响,条目。
星期四, 六月 03, 2004
horse |
1GB网络U盘与一个音乐blog
前阵子从ET-朝阳星火知道1GB网络U盘了,地址是http://www.1g.com.cn
现在到6月10日免费注册。我是想,如果类似“暖暖日记”的blog和1GB网络U盘结合,似乎能够给大家带来更多的快乐。更详细地参看:快来抢1GB网络U盘!
redwolf |
3721的"势不可挡":草根的抗争?
数家安全防护公司先后将臭名昭著的3721代码定性为病毒,同时也很有规律的迅速澄清失误,金元魅力势不可挡,令有识之志空欢喜一场;某些元老级社区里义愤填膺的同胞甚至表示要捐款公诉,虽然难以成行,你看,认清事实的同学们对此的忍无可忍可见一斑。
我原本纳闷过为什么连新手都可以看出优劣的东西能混到现在,今天看到一资源网站有同学张贴出3721为其开出的账单,恍若大悟,冷汗直冒,不愧是中国人整中国市场,yahoo太聪明了,这招狠,保管大多数中国的站长们顶不住:
尊敬的XXX,
您于2004年0X月X日注册成为3721搜索大同盟成员,您的基本信息如下:
登录代号:XXX
收款人:XXX
收款地址:XXX
邮政编码:XXX
请您确认上述信息,以免影响您的结算。
在2004年X月期间,您的分成情况如下:
上月结余:0.X3元
本月收入:4X8.94元
应付:4X9.37元
代扣税额:1X.58元
手续费:X.07元
------------------------
本月应付:4X2.72元
请您核查上述内容,如有疑问,尽快与我们联系(联系信箱:union@3721。com)。
3721搜索大同盟结算说明: 1. 本月10日,我们将为不提供发票的会员结算;
2. 佣金的邮寄费用和相应税金将从佣金中扣除。
3. 遇节假日,结算日期顺延。
祝,合作愉快!
3721搜索大同盟2004年06月03日
我这样的人平均每天使用搜索引擎三十次,恩恩,算起来真的很方便被用来做赚钱工具呢~
如果你还没在host里屏遮掉3721,可以从这儿了解这项交易,当然,如果你感兴趣,不会有人阻止。
观察加入这个联盟的网站,我们只在关键位置看到yahoo搜索引擎的标志,听起来不比google差多少的单词,点击进入才发现原来是3721引擎----使用这个引擎会造成什么后果各位心知肚明。
一些曾经常去的网站加入了这个赚钱大家庭,我不得不将它们的link屏遮;
中文blog圈大多使用google免费代码提供引擎服务----虽然有着UTF8麻烦;
偶忍不住遐想内地公网最后一块净土何时会沾染上可怕的3721~
末了
我还是欣赏中国人的智慧,窃以为不久以后会出现诸如3721自动点击搜索机器人这样的好东西,说不定还会有分布式处理的……嗯,有他们头痛的日子在后头。
在此遗憾----我是不是该把yahoo也屏遮掉?
很不幸的听说msn的广告中也出现了3721的芳踪……
搜索SPYBOT,看看你的计算机里莫名其妙的钻进了什么东西。
其实我不反对脚本,只要他们不至于引起各种系统故障并且能为我所选择的卸载,好歹给我这个自己计算机的主留一点面子嘛……连这点都满足不了,草根的日子真是凄惨~_~
当所有的安全防护公司在金元外交面前睁一只眼闭一只眼时,拥有势大的Yahoo做后台,横行于法制不健全的中国内地,斗志昂扬的定向残害中文用户……噢,平凡如我者穷困如我者要怎样获得自己计算机的主权?
Eric Nash |
群众的力量

《群众的智慧》一书认为大众能够比精英更聪明,更能解决问题,更能发明创造,更能做出聪明的决定。这是一个很有意思的话题,答案也不是一定的。不过这种理论无疑是blog重要性的依据之一。但是就象我们以前讨论过的那样,这个大众怎么定义/就象草根怎么定义一样/,精英怎么定义都是问题。
PS, KESO做了从新装修。
topku |
Let's Thank Blog
另一神奇牛人、来自MS的王建硕受到其美国同事启发,把其友情链接当作所收获的绝妙礼物,逐一介绍以此为礼分享与众人,独乐之后众乐,倒也其乐融融.其中说到偶是坚定的反某某某斗士,实在受之有愧有过,况且毛"教导"说,要少说话多干实事,要多赚钱少耍嘴皮子---想想还是这个好啊:)钱赚多了有雪糕买,多幸福!
做实事,在此感谢Eric兄的勤奋带动和Tian MM的有内涵的文化展现;以及David和iBuzzo绝妙的创意实践.
Tian |
Blogtalk 2.0欧洲网志会
4组主题演讲者各擅一方:首先是“活字印刷”的Mena与Ben Trott这一对;然后是Eastgate的Mark Bernstein;第三位是学界中人,Toril Mortensen,专长在网上游戏研究,演讲内容出自她去年9月通过答辩的论文;第四位是美人Nicola Doring(o上有两点),她是从事传播与媒体研究的心理学家。
BlogTalk是第一本研究网志现象的学术书,也是本次会议的资助人。书16.80欧元一本,竟然是“按需制作,没有存货”。会议注册费55美金,学生和网志作者注册费37美金。
via Suw Charman @ Chocolate & Vodka
多说一句,suw是《自由文化》有声书的“作”(诵?)者之一,在下与她会面于Prof. Lessig的伦敦演讲会。
星期三, 六月 02, 2004
ooof |
中午时,突然有个想法
具体方法:
1.可以制定一个标准的分类方法,然后联合各blog服务提供者,把用户的分类目录做成一致的。这样,各个服务提供者可以在自己网站陈列自己网站内的目录,还可以有一个集中的网站陈列全部的目录。
2.目录的数据库可以分布在各个服务提供者处,开放统一的检索标准。也可以有一个专门的服务器负责收集并把数据集合在一起陈列。
这样可以获得一个综合、全面的blog目录。
但,无疑,重任在于需要有恰当的实体来组织目录的分类标准,并获得广泛的blog服务提供者认可。
Eric Nash |
wikipedia改版

update: wikipedia的current events版非常象一个人人可以书写的blog:

Tian |
编码标准与符号学转向
我有两个同名网志,一个用UTF-8,一个用GB2312。海峡之隔,编码互异。
刘禾在一次有关帝国研究的访谈中提及,19世纪后半叶至20世纪初,皮而斯(Charles Sanders Peirce)与索绪尔(Ferdinand de Saussure)两位符号学家在构想符号学的同时,国际政治也在经历刘禾所称的“符号学转向”:各种人造符号:旗语、灯语、电报符码、路标、手语、世界语等等,纷纷出现。国际会议/公约(international convention)则是当时统一符号系统的讨论平台。
历史似乎在重演。今天,我们又开始讨论如何统一虚拟空间的符号系统。是不是不再有公约(convention),而只会有协议(protocol)?焦距缩小到汉语网志空间,CNblog.org似乎是扮演了讨论平台的角色,而目前的讨论集中于以下数项(欢迎补充):
1 blog系列词汇的得体汉译;
2 建立汉语网志引证标注规范;
3 统一编码标准;
......
今天在虚拟空间进行的“符号学转向”较前一次究竟有多少区别?这是留给后辈史家的问题了。
下回BSP们西湖论剑,是不是讨论一下新一代“人造符号”先?
(原发于http://www.blogbus.com/blogbus/blog/diary.php?diaryid=202280)
星期二, 六月 01, 2004
Eric Nash |
bloggers run ad compaigns on Google

Tian |
强化支持“引用”与“评论”:现有网志出版系统的改进可能
引证标注直观地体现出知识传承、累积、生产/再生产的线索。网志形式对现有的引证标注风格又有更生动灵活的贡献与补充。CNBLog近期的相关讨论成果如下:中文心得集中,Eric强调标注信息源,并建议了具体引文用斜体;horse建议推广水木清华“自动发掘引用通告”;英文心得集中,Dan Li对哈佛法(Harvard Style)的积极思考与对引证标注规范的详细建议亦值得诸位同人咀嚼(在下已建议hengge汉译此文做工作参考)。以上3篇重要文献,或可帮助整合出成文的汉语网志建议引证标注规范。
走远一步,这个规范能否涵盖语音引用(audio trackback)和图像引用(image trackback/moving images trackback)?
另外,在文献分析指标中,既有“他引率”,也有“自引率”。现在的系统显然不支持“自引”,能否改进?
中场休息,插映八哥集两条:中文Blog心得集不支持引用,fotopages.com也不支持引用。
下半场讨论“回响”/“评论”。
1。评论与原文的关系
我认为,评论与原文可以看成对等的关系。所谓“批评亦是创作”。在下伦敦大学校友董桥先生认为,上等译手与作者的关系是“月上柳梢头,人约黄昏后,平起平坐,谈情说爱,了无顾忌”。移植于entry与comment,亦可做如是观。自媒体(We-Media)的微循环也是在原文与评论的往复激荡中完成的。
在下是读历史的学生。一手史料来自考古挖掘、文献分析(档案研究归于此)和采访(口述历史材料)。网志开放评论与引用的结构予我莫大的欣慰:档案建立、研究与采访对谈即可在这个结构中同时实现--或许都需要一个新词指代这种知识考古/管理/生产方式了。这是前辈史家无法想象的。
2。系统支持值得改进之处
基于对1的认同,我建议各位软件建筑师改进现有的网志出版系统。
2。1 评论亦开放评论与引用。
2。2 评论不设字数限制,编辑页面功能项同entry编辑页面,至少可以做超级连接、贴引用吧。
(原发于:http://www.blogbus.com/blogbus/blog/diary.php?diaryid=200509)
星期一, 五月 31, 2004
topku |
Blogging Something New
Keso的辛辣语言,戏说作弊的新招数,看来VC中有人也还真是迷信.
MindMeters有了自己的Blog,似乎记录的是生活杂记;MindMeters印象中似乎是加拿大华人开的吧,新的思想站点,如果借助某个手法搞个宣传攻势,肯定大把拥众;可惜人家是有品位的,酒香不怕巷子深.
这位Eric兄有了个Blogasia,那条龙偶很喜欢:

日本互联网新星猛推Blog服务,说的是Joi,似乎看到了孙正义的影子,不管怎么样,商业化总是要领袖人物的,中国呢?这里是Joi的公司Blog群体.
一位湖北的朋友发信我要求友情链接,于是知道了这个服务BlogClan;同时新的服务还有beok.net;大家都叫XX部落,呵呵,何必呢
对,他们叫博录,据说还是第六媒体代言人,定位倒是鲜明,不过够炫的了,晕倒!似乎是广州的公司也.
新的不断涌来,我在怀念旧的岁月,不断有人发短信发EM问我怎么了,抱歉我真的不知道,Sorry!但我们会尽快恢复,Srooy again!
horse |
Gmail的Labels似乎很适合blog使用
一个是我问为什么对中文支持很差,我直接在Gmail的web页面写信都是乱码。Gmail Team回复如下:
Although Gmail users can communicate with one another in a variety of languages, messages sent to or from other email providers may be encoded in a format that causes the text of a message to be unreadable. Gmail uses UTF-8 encoding for all messages. If you are unable to send or receive messages in languages other than English, we suggest adjusting your browser's encoding settings.
这种问题blog世界里就经常出现,估计其它编程的人员也可能遇到。所以Gmail Team建议我使用UTF-8编码,但是我在IE改后,Gmail倒是没什么问题了,可是一些其它的网页显示起来似乎有问题。有些麻烦啊~
第二个我是问为什么我无法将信件发给我的sina.com邮箱,而且没有收到退信??退信我后来倒是反反复复地收到……这个似乎已经解决了,但是sina邮箱一直没法正常收信。Gmail Team的回答格外老实:
Thank you for your report. We apologize for any inconvenience this issue may have caused. We are aware of this problem, and our engineers are working diligently to find a solution. We appreciate your patience during our limited test period, and we thank you for taking the time to send us your feedback and concerns.
嗯,服务态度很好。对于很多事情我都是懒得提意见了,因为你很清楚提出了意见也石沉大海或者面子上说说,没有实质的回复,但是google公司的Gmail Team给我的印象还是满好的。如果国内所有的公司都如此就好了。Keso同学前两天还感叹了一把:我对国内电子邮件服务没信心,估计其它人也会如此,最近听到相关抱怨挺多,比如垃圾邮件太多,而且很多网站注册时明确建议不要使用sohu、163等的信箱。
使用Gmail没有感受多的好处,但给我印象很深的是它的Labels功能,这个是你可以设定若干标签,然后可以给每篇文章标注一个、两个或者更多标签,查找起来按照标签很方便。感觉这个很适合blog,因为blog按照日期排列,不太提倡分类,尤其二级分类;另外一个文章可能涉及两个或者多个主题,处理起来也很麻烦??而Labels却可以很方便地解决这些问题。提出一个建议,可以讨论,对于那些blog服务商或者有意在此领域有商业作为的人,可以参考一下。
星期日, 五月 30, 2004
Eric Nash |
Find a reason for blogging
尽管轰轰烈烈,随大流进入了blogger的行列,开初也是一场兴奋,除了自己做美化,自己写文章,还能听到别人的comment,还能看别人的blog; 这些都需要时间,这样blog着,直到有一天,你突然觉得没意思了,自己没心思写了,看看别人堆砌的文字,也觉得很无聊了。你郁闷了。
不要紧,不想博了,就不要博了,走了。blog的好处是,你不想了就走,你想了还可以回来吗。无所谓,自由。就想你自由地在你地blog里侃侃而谈。我是国内比较早开始blog的,断断续续,断了好长时间了,但一直就没离开过,不博的时候也看看别人怎么博,现在有时间了又开始蹦蹦跳跳了。
blog,需要给自己找到理由。不要为了博而博。这个理由最好是为自己的。每天都有收获,这种收获首先是满足自己的。blog和任何其他事情一样,先要想清楚了再做。需要做吗?需要的时候做,不需要的时候不做。就这么简单。







