网上有关“问答搜索系统的发展历史?”话题很是火热,小编也是针对问答搜索系统的发展历史?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。
搜索引擎的起源:
所有搜索引擎的祖先,是1990年由Montreal的McGill University三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明的Archie(Archie FAQ)。Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。 由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
编辑本段搜索引擎的发展:
发 展(1):
世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL) 。 搜索引擎一般由以下三部分组成: 爬行器(机器人、蜘蛛) 索引生成器 查询检索器
发 展(2):
Excite 的历史可以上溯到1993年2月,6个Stanford University(斯坦福大学)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers。 注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎 Dogpile
发 展(3):
1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和David Filo共同创办了Yahoo!。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。 注:Yahoo以后陆续有 Altavista、Inktomi、Google提供搜索引擎服务 Yahoo!--几乎成为20世纪90年代的因特网的代名词。
发 展(4):
1995年,一种新的搜索引擎形式出现了——元搜索引擎(Meta Search Engine)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。 第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎概念上非常好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。
发 展(5):
智能检索的产生:它利用分词词典、同义词典,同音词典改善检索效果,进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典检索处理形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。 例: (1)查询“计算机”,与“电脑”相关的信息也能检索出来; (2)可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴; (3)还包括歧义信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。
发 展(6):
个性化趋势是搜索引擎的一个未来发展的重要特征和必然趋势之一。一种方式通过搜索引擎的社区化产品(即对注册用户提供服务)的方式来组织个人信息,然后在搜索引擎基础信息库的检索中引入个人因素进行分析,获得针对个人不同的搜索结果。自2004年10月yahoo推出myweb测试版,到11月a9推出个性化功能,到2005年Googlesearchhistory基本上都沿着一条路子走,分析特定用户的搜索需求限定的范围,然后按照用户需求范围扩展到互联网上其他的同类网站给出最相关的结果。另外一种是针对大众化的,Google个性化搜索引擎,或者yahooMindSet,或者我们都知道的前台聚类的vivisimo。但是无论其中的哪一种实现方式,即Google的主动选择搜索范围,还是yahoo,vivisimo的在结果中重新组织自己需要的信息,都是一种实验或者创想,短期内无法成为主流的搜索引擎应用产品。
发 展(7):
网格技术(great global grid):由于没有统一的信息组织标准对网络信息资源进行加工处理,难以对无序的网络信息资源进行检索、交接和共享乃至深层次的开发利用,形成信息孤岛。网格技术就是要消除信息孤岛实现互联网上所有资源的全面连通。 美国全球信息网格(Global Information Grid) Robot(机器人)一词对编程者有特殊的意义。Computer Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序像蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider程序。 1993年Matthew Gray开发了 World Wide Web Wanderer,这是第一个利用HTML网页之间的链接关系来检测万维网规模的“机器人(Robot)”程序。开始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获网址(URL)。 1994年4月,斯坦福大学(Stanford University)的两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。雅虎于2002年12月23日收购inktomi,2003年7月14日收购包括Fast和Altavista在内的Overture,2003年11月,Yahoo全资收购3721公司。 1994年初,华盛顿大学(University of Washington )的学生Brian Pinkerton开始了他的小项目WebCrawler。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。 1994年7月,卡内基·梅隆大学(Carnegie Mellon University) 的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。 1994年底,Infoseek正式亮相。其友善的界面,大量的附加功能,使之和Lycos一样成为搜索引擎的重要代表。 1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理,提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。 1995年12月,DEC的正式发布AltaVista。AltaVista是第一个支持自然语言搜索的搜索引擎,第一个实现高级搜索语法的搜索引擎(如AND、 OR、 NOT等)。用户可以用AltaVista搜索新闻组(Newsgroups)的内容并从互联网上获得文章,还可以搜索名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。 1995年9月26日,加州伯克利分校助教Eric Brewer、博士生Paul Gauthier创立了Inktomi,1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好设置。 1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News、7100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。 1998年10月之前,Google只是斯坦福大学(Stanford University)的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日。Google以网页级别(Pagerank)为基础,判断网页的重要性,使得搜索结果的相关性大大增强。Google公司的奇客(Geek)文化氛围、不作恶(Don’t be evil)的理念,为Google赢得了极高的口碑和品牌美誉。2006年4月,Google宣布其中文名称“谷歌”,这是Google第一个在非英语国家起的名字。 Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。(2003年2月25日,Fast的互联网搜索部门被Overture收购)。 1996年8月,sohu公司成立,制作中文网站分类目录,曾有“出门找地图,上网找搜狐”的美誉。随着互联网网站的急剧增加,这种人工编辑的分类目录已经不适应。sohu于2004年8月独立域名的搜索网站“搜狗”,自称“第三代搜索引擎”。 Openfind 创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域。 2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。2001年8月发布百度搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索。Baidu搜索引擎的其它特色包括:百度快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、mp3搜索、Flash搜索。2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快。后推出贴吧、知道、地图、国学、百科、文档、视频、博客等一系列产品,深受网民欢迎。2005年8月5日在纳斯达克上市,发行价为USD 27.00,代号为BIDU。开盘价USD 66.00,以USD 122.54收盘,涨幅353.85%,创下了5年以来美国股市上市新股当日涨幅最高纪录。 2003年12月23日,原慧聪搜索正式独立运做,成立了中国搜索。2004年2月,中国搜索发布桌面搜索引擎网络猪1.0,2006年3月中搜将网络猪更名为IG(Internet Gateway) 。 2005年6月,新浪正式推出自主研发的搜索引擎“爱问”。2007年起,新浪爱问使用google搜索引擎。 2007年7月1日 全面采用网易自主研发的有道搜索技术,并且合并了原来的综合搜索和网页搜索。有道网页搜索、搜索和博客搜索为网易搜索提供服务。其中网页搜索使用了其自主研发的自然语言处理、分布式存储及计算技术;搜索首创根据拍摄相机品牌、型号,甚至季节等高级搜索功能;博客搜索相比同类产品具有抓取全面、更新及时的优势,提供“文章预览”,“博客档案”等创新功能。
当前,新一轮的 科技 革命和产业变革正在加速推进金融数字化转型,而金融 科技 的转型也带动了金融行业服务器及存储市场、金融行业数据库自主创新等多项需求的持续增长。
面对行业需求,包括中兴通讯、华为等在内的设备厂商以及大型互联网公司均开始大力布局。为了打开金融市场的局面,中兴通讯选择了高门槛的分布式数据库作为突破口。经过多年研发,截至目前,公司的分布式数据库GoldenDB已成为国内首个在大型银行核心业务系统正式商用的国产金融交易型分布式数据库,并在运营商市场实现突破。
事实上,数据库作为数据基础设施的关键组成部分,近年来受到各个企业的高度重视。从发展历程来看,国产分布式数据库从2011年陆续起步。当时以Oceanbase、巨杉数据库、TiDB为代表的国产分布式数据库相继诞生。其中Oceanbase最初主要用于阿里巴巴集团内部;巨杉数据库于2013年正式发布商用版本,并持续服务于金融银行行业。随着像数字金融等新业务的兴起,分布式架构、云原生开始在金融领域流行起来,并成为发展过程中必不可少的技术基础。
金融市场无疑是一块大蛋糕,但要想在金融领域竞争绝非易事,尤其是在基础设施、数据库等领域,存在着大批市场竞争者。这里既有IBM、Oralce这种在金融领域耕耘多年,早已具备了相对完善的产品、解决方案和售后服务系的老牌公司;还有阿里云、腾讯云、金山云等互联网新贵,以及华为等设备厂商。
“数据库是整个金融 科技 创新的发动机。”中兴通讯高级副总裁俞义方在近日举办的2021年度中兴通讯金融云网生态峰会上说道。据他介绍,原来所有的金融企业主处理器都是大型机和小型机,换不到X86,因为数据库是集中式,所以只能装在大型机上面。
自2014年开始,中兴通讯启动了金融级数据库的研发,并与中信银行合作,推出分布式数据库产品GoldenDB。“当中兴把分布式交易数据库做出来的时候,不仅能够解决对大小机的限制问题,同时也为银行从传统业务拓展到移动支付领域提供了基础。此外,再加上现在云平台的成熟,换台机器对银行来说一点不会受影响,这才是把整个金融 科技 创新的底座彻底建立起来了。”俞义方表示。
中兴之外,近期多家大型厂商也纷纷致力于对其数据库进行升级和迭代。9月底,华为云GaussDB推出了支持RPO=0的数据库同城双集群高可用方案,即主集群在出现故障的情况下,备集群还具备继续提供服务的能力,当发生自然或人为灾难时,保护数据并快速进行恢复,对数据丢失零容忍。
今年6月,OceanBase宣布基于木兰许可协议开源了300万行核心代码,提供免费软件版本。OceanBase数据库来源于蚂蚁,在支付宝得到全场景应用,2017年开始对外输出技术服务,在国内金融、交通、铁路、航天等领域都得到应用。
对于运维和安全方面,郭树波则介绍称,中兴会无偿支持一些运维的定制化需求,保证更好的、高效的运维。而安全侧,中兴通讯全部买的是完整版权,而且会通读,把里面所有的安全漏洞去掉,从而避免服务器留后门。
解决方案的落地离不开基础服务器等的支持。IDC曾预测,到2025年全球数据量将达到175ZB。数据井喷之际,在给服务器存储市场发展带来强劲动力的同时,也对服务器存储的性能、可靠性和创新性提出了更高的要求。如何让数据真正实现“存得下、流得动、用得好”,也在考验着产业链上每一个玩家的技术实力。
据IDC日前发布的《全球服务器季度跟踪报告》显示,今年第二季度全球服务器市场收入同比下降2.5%至236亿美元,而出货量约为322万台,同比增长了0.1%。具体到厂商来看,HPE/新华三以37亿美元的营收,15.7%的市场份额,排在第一位;戴尔 科技 以15.6%的市场份额排在第二;浪潮/浪潮商用机器则以9.4%的收入份额排名第三;而联想排名第四,IBM名列第五,份额分别为7.0%和5.0%。前五名的排名相比于去年同期并未发生变化。中兴虽然增长了51.6%至1.49亿美元,但市场份额很小,为0.6%。
虽然国内服务器市场竞争激烈,但郭树波认为,差异化的竞争往往还是体现在产品上。“之前国内某大型股份制商业银行要做 科技 创新,他们认为普通的通用服务器不一定适合,所以提出定制化采购的试点,当时其他服务器厂商不愿意合作,卖标准品就可以了,我们是唯一一个服务器厂家去给他们做定制化试点的,并且承接他们很多运维需求,最后逐渐获得这家银行的认可。”
中兴通讯执行副总裁、首席技术官王喜瑜说道:“金融行业现在是,将来也一定是中兴通讯政企业务的战略主航道。”
不过,厂商发展服务器业务也并非一帆风顺,供应安全问题就像一把达摩克里斯之剑悬在中国半导体产业的头上。
每日经济新闻
关于“问答搜索系统的发展历史?”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!
本文来自作者[努力啊大安蕾]投稿,不代表绿康号立场,如若转载,请注明出处:https://nmgjkcy.com/lukang/4531.html
评论列表(3条)
我是绿康号的签约作者“努力啊大安蕾”
本文概览:网上有关“问答搜索系统的发展历史?”话题很是火热,小编也是针对问答搜索系统的发展历史?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。搜...
文章不错《问答搜索系统的发展历史?》内容很有帮助