搜索的故事

选择字号:   本文共阅读 7830 次 更新时间:2001-10-15 09:59

进入专题: 李彦宏   网络与计算机  

李彦宏  

时间:10月13日下午2:30-4:00

地点:图书馆南配楼

主讲人:李彦宏, 百度在线网络技术公司总裁. 1991年毕业于北京大学信息管理专业,随后赴美国布法罗纽约州立大学完成计算机科学硕士学位。在美国的8年间,李彦宏先生先后担任了道·琼斯公司高级顾问, 《华尔街日报》网络版实时金融信息系统设计者,以及在国际知名互联网企业-INFOSEEK资深工程师, 是新一代互联网技术领域的权威专家。他为道·琼斯公司设计的实时金融系统,迄今仍被广泛地应用于华尔街各大公司的网站, 其中包括《华尔街日报》的网络版。他最先创建了ESP技术,并将它成功的应用于INFOSEEK/GO.COM的搜索引擎中。GO.COM的图像搜索引擎是他的另一项极其具有应用价值的技术创新。1996年,他首先解决了如何将基于网页质量的排序与基于相关性排序完美结合的问题,并因此获得了美国专利。1998年,李彦宏先生根据在硅谷工作以及生活的经验, 在大陆出版了《硅谷商战》一书, 获得了各界的好评。1999年底, 携风险投资回国与好友徐勇先生共同创建百度网络技术有限公司.

以下是讲座部分:

今天我很高兴回到学校和大家一起交流。在说“搜索的故事”之前先说说我自己的故事。在北大念完本科之后,92-94年我在国外念书,当时虽然人在学校但是我始终在关注、跟踪有关搜索的信息。94年我离开了学校,这在当时并不是一件很容易决定的事情,我所在的计算机系是一个不错的系,很多人都是希望能最后拿到PHD的。我做出这个决定和我个人的兴趣有关。93年夏天,我在普林斯顿实习。日本松下公司在普林斯顿有一个计算机研究院。松下想把全美最好的computer scientist集中到一起做一个前瞻性的而且是实用性的东西。松下在全美高校中选了一些人参加这个项目,我有幸入选了。在普林斯顿实习的这三个月时间里,我发现工业界与学术界的研究是不一样的。学术界至少要向前看五年,它所解决的问题是在以前就提出来的,或许是在很早以前就被提出但是一直得不到解决的问题。而工业界是通过自己的思考提出问题的,并且问题的解决能在近期内看到应用。

我个人的兴趣接近于应用,也就是说我希望我所解决的问题可以在2-3年内看到应用。所以实习结束回到学校之后,我就决定离开学校进入工业界。我认为继续读下去拿PHD不如进入工业界。我把我的想法跟我的导师说了,他是一个开明的老师,他说他支持我。于是94年我就离开了学校,离开学校时我拿到的是master学位。

我第一份工作的主要任务是做实时金融新闻信息的检索,老板说这个工作与我在学校所学的ocr不太一样,他问我是否介意,我说不介意,因为这与我的兴趣是相符的。我在决定不读PHD 后对于进哪一家公司并没有做太多的考虑。94年internet开始商业化,web出现。大家都看出web和媒体结合的趋势。我当时参与了《华尔街日报》的设计与制作。《华尔街日报》的一个特殊之处就是它是一个收费网站,非订户是看不到它的内容的。现在它大约有一百万的在线订户,是全世界最大的收费网站。

96年初我到拉斯维加斯参加一个学术会议(因为ocr发展不好,这个会议现在已经取消。)我在会上听别人讲的少,一般都是自己思考,或者有时候别人提出问题后我会往深里想一想。我考虑到一个问题:信息搜索被expand的情况很厉害。这是什么意思呢?网页制作者为了能排在searching me的前列,就把背景颜色做成和中文颜色一样。访问者是看不到这些的,但是当searching me去抓时就能看到。搜索频率越高的东西被expand的情况就越严重。这个问题如何解决?我开始思考。我们都知道有一个“科学引文索引”,一篇论文被引用得越多就说明其越好,学术价值就越高。这让我得到启发,我想这是一种评价相关性:不是这个网页认为你讲什么就是什么,而是别人认为你讲什么就是什么。这样我想到可以通过链接网站的多少来评价被链接的网站。我想出这个idea之后就用Java、IBM等词试了一下,结果发现搜索的效果很好。我把我的想法跟老板说了,并且告诉他我一要申请专利,二要得到公司的支持。老板并没有表现得特别热心,而是把这件事情放下来了。我想要是不及早开发机会错失良机,也许几个月之后别人也想到了。后来我就自己出钱搞,这时老板却出来说我这个是职务发明。我说你不支持呀,他说支持。老板“支持”了一段时间之后,我发现效果不太好,我自己搞得有点灰心了。但是现在回过头来想一想,在96年管理层是不大可能意识到超链分析的意义的,所以老板不支持我也是很自然的事情。

后来我到加拿大开会,在会上我阐述了超链分析的思想。正好美国有一家网站当时正在苦苦思考如何解决expand的问题。所以他们对我的发言很感兴趣。他们的总裁对我说:你是一个engineer,你应该让别人用你的东西,如果你到我们网站来,你很快就可以把你自己的想法做出来。我开始意识到不是华尔街而是硅谷。

于是我先到硅谷考察了一下,然后加入了这家网站。我用半年时间实现了超链分析这个东西。98年4月,他们推出的ESP实际上就是超链分析。不过当时并没有公开说这个技术就是用超链分析做的。

从97年下半年到99年底我一直在这家公司工作,这是我在国外收获最大的一段时间。我进入公司时只有一百多人,当时公司虽然已经上市,但是股票价格很低。到我离开的时候公司已经有两千多人了。所以我经历了公司从创业到成长的过程。我看到公司有哪些做得还可以又有哪些地方出现失误。我刚进公司的时候职位不高,但是每天能接触到chairman,他的身价达几亿美元,但是他看起来像是很普通的一个人。很多时候他关注很琐碎的技术问题,他经常和我争论,有时他能说服我有时不能。公司的文化是平等的、不存在等级,大家都是为了把事情做好。我在公司里学到最多的就是如何创业。

随着公司的壮大也出现了一些较大的失误,在管理层中间真正懂internet的人并不多。有些从传统产业进来的管理者他们对网络的认识还不够。由于他们对internet的误解以及过于保守的做法使得公司错过了很多机会。后来他们与Disney合作,最后被对方吞掉。

公司的这些失误使我逐渐萌生了离开的念头。1999年五十年国庆的时候我回国做了一些事情。回国之后我看到国内有一些很好的机会。现在Internet在中国很普及、网民很多,但是在繁荣的背后也存在很多问题,最大的问题就是缺乏技术或者依赖于国外的技术。这种情况在搜索引擎上表现得尤其严重。国内有很多人认为分类目录就是搜索引擎。输入词后五秒钟还没结果有人认为是正常的,而在国外要是一秒钟之内还没有结果,大家就认为这个引擎不好。

国内internet缺乏技术的情况对我是个机会,我最熟悉的就是searching me。作为中国人,我相信我做的中文搜索引擎一定比境外的好。所以回国后我就准备创业。99年10月份,我开始注册公司。我起的域名取自辛弃疾的名句:“众里寻她千百度,蓦然回首,却在灯火阑珊处。”我想一个域名应该符合三个标准,一是:available,二是:短,三是:能体现一定的层次和意境。域名不能直接说出公司是做什么的,但又不是完全和公司的业务不着边际。这种起名的方法也是我在国外学到的。

我和一位朋友共两个人,带着一份十页纸的商业计划书开始了最关键的一步:融资。我们找到两家真正的风险投资公司,最后我们带着120万美金飞回北京。说到第一轮融资,有人对这个过程很感兴趣,我简单的说一下。

融资最重要的是要向对方说明我们要做什么,以及我们为什么能做这件事情。他会质问我们的能力。我们去第一家风险投资公司的时候,投资商就问我:“你说你能做世界上最好的中文搜索引擎,那么你认为现在世界上最好的搜索引擎是什么?”我说了我的看法,他又问:“你认识他吗?”我说认识。他再问:“他认识你吗?”我说认识。他让我自己先坐一下,过了十分钟他回来了,他说:“我去给那个人打电话了,我问他是否认识你,他告诉我认识你。我还问他怎么评价你的能力,他说你能做世界前三位的搜索引擎。”就这样他们答应给我们融资了。我们的第二家风险投资商是他们给我们找的。第二个投资商问我:“要是我多给你一些钱,你能不能早一点把项目开发出来?”我说不能。他就让我先出去,但最后他还是愿意多给我们钱。就这样我们原定融资100亿美金,最后到手的是120亿美金。

在融资过程中,我的体会是:做不到的事情不要说自己能做到。虽然我们最后只用了四个月的时间完成了原定未半年的开发任务,但是我当时还是告诉我的投资商我们不能提前完成。我们开始并没有和员工说融资的事情,因为我们的风格是:没有做到的事情不说。9月份,香港银行给我们打电话说融资已经到帐户上。我马上召集员工开会,告诉大家这个好消息。这也是我们百度的另一个风格:有消息决不隐瞒。我数了一下,会议室里总共只有二十三四个人。就靠我们这些人,在IT业不景气的情况下,我们融资120亿美金,这意味着什么?融资成功之后,我们和北大计算机系的副教授以及他的学生开始开发百度搜索引擎。百度的服务魅力在于:全天候的服务;保证速度;可扩展;可靠性达99.9%。现在百度为中国四家最大的门户网站:新浪、搜狐、263和tom.com提供搜索引擎服务。百度是中国最好的ESP。

关于百度:

1999年12月 成立于硅谷

2000年1月 回北京

2000年6月 正式推出全球最大、最快、最新的中文搜索引擎

2000年7月 申请中国互联网领域第一个技术专利—中文人名识别技术

2000年8月 开始为全球最大的中文门户网站提供搜索引擎服务

2000年9月 DFJ、IDJ等四家国际著名风险投资公司联合注资

2000年12月 百度检索市场份额达到80%

2001年 百度产品线全面扩展:网事通、网站加速、竞价排名

百度搜索

·完全自主知识产权的可扩展性核心技术

·全球最大的中文网页数据库,每天支持全球最多的中文网页

·查得多(信息量大:六千万网页)、准(相关性好:独到的相关性排序及算法)、快(反应速度小于一秒)、新(更新率:24小时)、符合中国文化与语言特点.

    进入专题: 李彦宏   网络与计算机  

本文责编:王文佳
发信站:爱思想(https://www.aisixiang.com)
栏目: 科学 > 科学演讲
本文链接:https://www.aisixiang.com/data/2144.html
文章来源:本站首发

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2024 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号-1 京公网安备11010602120014号.
工业和信息化部备案管理系统