建筑分馆

哈工大图书馆建筑学学科服务博客

« 沈在红校友在美国传授风水学台湾大学《教授为什么没告诉我》 »

用“基因”搜好书:搜索引擎介绍

    搜索引擎在法律上称为定位工具。 

    “书海明灯”不是按照作者名气、畅销程度或图书类型为指标,而是分析出一本书包含的各项DNA,用户只要设定所需寻找的书籍的DNA参数,相似或相反都可以,即可轻易找到想要的书籍。
    “书海明灯”网站的运行原理其实很简单,就像Pandora.com或豆瓣电台会根据你的收听喜好推荐音乐,只不过这里音乐换成了书籍。

    电脑能否为你推荐好书?
    最新也是最具野心的尝试,是将文学品味转化为书籍的DNA基因加以分析,网站“书海明灯”(http://booklamp.org/)基于此应运而生。网站采用的书籍推荐系统,既不以销量论英雄,也不会臧否孰优孰劣,仅仅是从内容本身出发,推荐你可能会喜欢的其他作品。“书海明灯”希望以抛砖引玉的方式,激励用户创造并分享他们自己的推荐程式,将网站变成一个爱书人的聚合平台,以前所未有的方式发现好书,分享好书。

    “书海明灯”于今年8月16日正式上线,“书海明灯”网站的运行原理其实很简单,就像Pandora.com或豆瓣电台会根据你的收听喜好推荐音乐,只不过这里音乐换成了书籍。网站在推荐书籍时,参考的是整本书的全部内容,而非仅仅是书名、类别、作者等小指标。它对整个作品的各种元素都有考量,包括文字节奏、密度、情节、对话、描述、观点、类型等等。而且,随着为你成功推荐的图书越来越多,具有自学功能的系统会适当自我调整,做出的推荐会越来越准确,越来越适合用户的个人口味。据悉,将来系统还会融入用户评价作为另一个参考,将社交网络的力量与电脑分析整合起来。

    因为这个系统是通过比对书籍本身内容这样一个客观数据来做推荐的,而非单纯依靠社交网络主观荐书,所以不会受到市场行为的影响,网站本身也不会受人为干扰,这保证了它的绝对公正性。在“书海明灯”上,你可以轻松地设定找书的具体参数。例如你想找一本内容接近史蒂芬•金(Stephen King)的《末日逼近》(The Stand),但又希望长度要减少一半、且更具有文学性、最好是第一人称视角讲述故事、对白再稍稍多一些、描述性文字稍稍少一些、头十个场景中情节发展呈上升趋势的书,那么“书海明灯”就是你最好的选择。也就是说,通过该网站你不仅能找到与你指定的书籍接近的其他书籍,而且你要找什么样的书,都可以通过设定参数来实现:十分接近《末日逼近》的书、或者与《末日逼近》大相径庭的书,都可以找到,而且整个系统都是免费应用的。

    “书海明灯”开发出了一个新名词叫做“故事DNA”,指的是分析每本书时要参考的指标:主要是故事背景和故事中出现的人或物,比如“森林”、“城市街道”、“中世纪武器”等等,都是一个个的故事DNA。用这些去做分析,每本书基本上有30000个DNA。这些故事DNA在“书海明灯”的首页上不断增加,目前总共为6亿多个,每周可增加600万个。而故事DNA还只是整个“图书基因组计划”的结构之一,还有语言DNA等,加在一起就能构成书本DNA。比如输入《罪与罚》,除了故事简介外,还会出来一个“书本DNA”的图标,其中语言部分有五个指标,动作、描述、节奏、文字稠密度、对话。而这本书的故事DNA则包括“痛苦和恐惧/负面情绪”“家庭环境”“犯罪调查/侦破工作”“财务问题/债务/金钱”等等指标,每个指标都用图标表示强弱。网页右侧就是根据这些指标推荐的书了,既有《罪与罚》作者陀思妥耶夫斯基的另一本作品《白痴》,也有狄更斯的《雾都孤儿》这种在“痛苦和恐惧/负面情绪”DNA中与之接近的书籍。

    和现有的亚马逊网站上的推荐项目,或是Goodreads.com 和Librarything.com等社交类的读书网站不同,“书海明灯”不是按照作者名气、畅销程度或图书类型为主要指标。按照网站的说法,它希望给你一种走进了二手书店或是散发霉味的图书馆的感觉,只是书架并非是按照图书类别分类的,而是按照你个人口味来分的。例如输入杜鲁门•卡波特(Truman Capote)的《冷血》(In Cold Blood),“书海明灯”会分析给你看其DNA组成:“这是本文字稠密的书,对话不少,主题包括司法审判、犯罪调查,外加一小部分家庭事务”;然后,会按照这些主题和文字风格指标给你推荐类似的书籍。如果输入乔治•奥威尔(George Orwell)的《1984》的话,出来的相似书籍还包括了《美国爱国者法案》,不过这可能纯粹是个黑色幽默啦。

    在谈及“书海明灯”的使命时,公司创始人Aaron Stanton说:“我们的目标其实并不是追求多快就能找到你想要找的书。我们的目标是让找书的过程变得有趣。真正像我一样的书迷才能体会到这种乐趣。我喜欢图书馆和书店,喜欢走进堆满了书的地方,每个书架上都有着未被发掘的无限可能性。我们想要的就是这种发现的乐趣。当然,真要快速找书的人,通过我们网站也能做到,只不过我觉得他们会错失很多乐趣。”

    目前来看,上线仅一个多月的“书海明灯”还没有达到理想的状态,最主要的原因是系统数据库中的书籍数量不够多,足够他们拿来分析的文本还很有限。理想状态是通过7到8项参数的比较,完成推荐,但如果数据库里只有300本书的话,或许只能做出基于3、4个参数的推荐。网站系统设计出来的初衷是可以应付10000到100万本书的运算,但目前远远还没达到这个容量(目前网站录有20000多本书,目标是年底达到10万本),所以暂时只能起到参考作用,还不能完全依赖“书海明灯”作为单一指标。除了数量以外,书籍的种类是如今“书海明灯”的另一个硬伤。最初,网站上主要都是科幻类和幻想类小说,因为这些书籍对于测试版系统来说比较容易获得和操作。由于小说的受众人数最多,目前网站决定先将重点放在虚构类作品全文搜索推荐上,将来还会纳入更容易用关键词归类的纪实类作品。

    此外,要多说一句的是,书评人、书评网站、出版商、作者丝毫不用担心“书海明灯”的推荐会影响他们的形象或销量,因为这个系统并不直接评判书本的好坏,它只是按照你设定的标准来寻找,至于什么叫好书,什么叫坏书,那标准还是由读者诸君来定吧。
    (来源:http://www.bundpic.com/2011/09/15876.shtml)

    建筑学(外文)图书检索http://architect.org/bibliography/

    研究生常用的十八大搜索引擎
    1、http://scholar.google.com/ 这个不多讲了。 
    2、http://qns.cc/ 后起之秀,科研人员的良好助手,上此网站的90%是从事科研的学生与老师。其词典搜索集成了目前市面上最好的在线英汉写作及科研词典,用此搜索引擎写作英文论文相当方便;其文献搜索集成了目前最优秀的数据库。
    3、http://www.scirus.com Scirus是目前互联网上最全面、综合性最强的科技文献搜索引擎之一,由Elsevier科学出版社开发,用于搜索期刊和专利,效果很不错!Scirus覆盖的学科范围包括:农业与生物学,天文学,生物科学,化学与化工,计算机科学,地球与行星科学,经济、金融与管理 科学,工程、能源与技术,环境科学,语言学,法学,生命科学,材料科学,数学,医学,神经系统科学,药理学,物理学,心理学,社会与行为科学,社会学等。 
    4、http://www.base-search.net/ BASE是德国比勒费尔德(Bielefeld)大学图书馆开发的一个多学科的学术搜索引擎,提供对全球异构学术资源的集成检索服务。它整合了德国比勒费尔德大学图书馆的图书馆目录和大约160 个开放资源(超过200 万个文档)的数据。
    5、http://www.vascoda.de/ Vascoda是一个交叉学科门户网站的原型,它注重特定主题的聚合,集成了图书馆的收藏、文献数据库和附加的学术内容。与google比较了一下发现,能搜索到一些google搜索不到的好东东。它界面简洁,功能强大,速度快,YAHOO、网易都采用了它的搜索技术。各位可以一试。
    6、http://www.a9.com Google在同一水平的搜索引擎。是Amazon.com推出的,Web result部分是基于Google的,所以保证和Google在同一水平,另外增加了Amazon的在书本内搜索的功能和个性化功能:主要是可以记录你的搜索历史。现在还是Beta,不过试用后感觉很好,向大家推荐一试,不过缺憾是现在书本内搜索没有中文内容。 
    7、http://www.ixquick.com 严格意义上讲不是搜索引擎,是连接搜索引擎和网络用户的信息立交桥。新一代的搜索引擎应运而生,Ixquick meta-search正是目前最具光芒的新星。但是对于大多数国内用户来说,Ixquick还很陌生。Ixquick众多独特的功能我不一一介绍了,只介绍我们最关心的,搜索数据库密码。使用方法:先进入Ixquick,以“Proquest”数据库为例。填入Proquest Username Password History Online后点击search,看看出来的结果,第一页中第6个,proquest的username和password赫然在目,别急,再看第4个结果“HB Thompson Subscription Online Databases”,即
    8、http://homework.syosset.k12.ny.us/onlinedbs/HBTDatabases/,进入后发现这是一个密码页,选择Magazines & Journals栏,就有 EBSCO、Electric Library E lementary、Electric Library Elementary、ProQuest Platinum (in school)、ProQues t Platinum (remote)等众多数据库的密码,都有uesrname和password,随便试一下EBSCO,OK,成功登陆。
    9、http://vivisimo.com,cmu的作品,对搜索的内容进行分类,这样可以有效地做出选择,比较有特色。可实现分类检索,检索速度也很好,如EBSCO密码几分钟就可找一大堆。http://search.epnet.com/ User ID: mountain Password: ridge这个密码可以试试。
   10、http://www.findarticles.com/ 一个检索免费paper的好工具。进入网页以后,可以看到他有三个功能,driectory web article ,其中article对我们很有帮助,你可以尝试输入你要找的文章,会有很多发现的! 
   11、http://www.sciseek.com/Sample 感觉不是很好用,内容也不是太多,主要靠用户添加网址,提供信息的搜索引擎,搜索功能也比较差,输入常见的关键词,往往找不到相匹配的内容。 
   12、http://www.chmoogle.com 现点击后或跳转到http://www.emolecules.com,在此搜索引擎里可以搜索到超过千万种化学品信息或相应的供应商,与Chemblink有点相似,但提供的化学品理化信息没有Chembli nk详细,与其不同的是该搜索引擎可提供化学品结构式搜索(主页上有在线绘制化学结构式的搜索框)。 
   13、http://www.ojose.com/OJOSE (Online Journal Search Engine,在线期刊搜索引擎)是一个强大的免费科学搜索引擎,通过OJOSE,你能查找、下载或购买到近60个数据库的资源。但是感觉操作比较复杂。
   14、http://citeseer.ist.psu.edu/ 一个关于计算机和信息科学的搜索引擎。 
   15、http://hpsearch.uni-trier.de/ 专家个人主页搜索引擎。 
   16、http://cnplinker.cnpeak.com/ 为了给读者用户提供一个方便快捷的查阅国外各类期刊文献的综合网络平台,中图公司组织开发了cnpLINKer(cnpiec LINK service)在线数据库检索系统,并正式开通运行。cnpLINKer即“中图链接服务”,目前主要提供约3600种国外期刊的目次和文摘的查询检索、电子全文链接及期刊国内馆藏查询功能,并时时与国外出版社保持数据内容的一致性和最新性。点评:只提供了外文检索的功能,但是无法得到全文。个人认为不是很理想。 
   17、http://guoxue.baidu.com/ 百度国学目前能提供上起先秦、下至清末历代文化典籍的检索和阅读。内容涉及经、史、子、集各部。 
   18、http://infomine.ucr.edu/ NFOMIN是由加州大学、维克森林大学、加州国立大学、底特律大学等大学图书管理员建立的学术搜索引擎。它主要为大学职员、学生和研究人员提供在线学术资源。

  • quote 2.cherrydouna
  • 很好的链接集锦!学科服务博客太到位了~
    wanfang 于 2012-3-21 10:06:12 回复
    欢迎你常来!并提出建议!有些链接过一段时间就打不开了,这是网络和数字资源存在的问题,不如印本资源更易永久保存。
  • 2012-3-16 23:02:19 回复该留言

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

日历

手机二维码访问

建筑学学术资源发现

最近发表

最新评论及回复

Powered By Z-Blog 1.8 Arwen Build 90619  Theme By Bokezhuti.cn

Copyright;2009-2009 blog.hit.edu.cn All Rights Reserved 哈工大网络与信息中心