
克里斯巴顿:好的。我想当时我只是在头脑风暴,想了很多点子……我当时想的是通过监控广播电台来识别音乐。我觉得没什么问题,我可以写个软件帮助电台监测他们的节目和播放列表。这对他们来说也是很有用的。接着我们就可以独家监控他们在放哪一首歌。有了这些之后,你就能创建一个类似Shazam的服务了,但是这只对电台放的音乐有效。
Shazam这个想法最终成型是我在伦敦商学院上策略创新(Strategic Innovation)这门课的时候。他们鼓励你跳出思维陈规,所以我就要从每个角度仔细考虑这个点子。我当时想,“好的,如果我建立了这个独家的广播电台监控网络,我是唯一一个知道他们在放什么的人,虽然我是唯一一个,但是其他人要怎样找到我呢?”然后我又想到,“上帝啊,如果他们用手机采集的声音就能知道电台放的是什么音乐会怎么样?”
这样你也就不需要这个独家软件和电台的独家授权了。你可以直接用声音识别就能做到。我觉得很显然之前还没有人能够做得到
第二关:团队
佩德罗桑托斯:为什么花了3年的时间才实现?
菲利普安格布瑞希:我们当时就在想,“如果你用手机就能识别出你所听到的歌曲,那得有多酷?”但是当时的音乐识别技术并没法用于这种使用场景。我们得要能够利用10秒钟的嘈杂录音在毫秒级的运算时间内从几百万首歌的里识别出来。我们觉得这是一个很好的概念,我可以用这个概念创造一个公司。这不是一般创业公司的做法,除非你是在生物技术或者类似领域,同时你又有几十年的临床经验。往回想一想,那是在1999年末,我和克里斯相识,而且那时候我们和迪拉伊慕克吉也认识了,他当时开创了Viant公司的伦敦分部。所以我们3个人就有了这个很好的主意,但也只是有个主意而已。
我们甚至都没有一个商业计划书,更要命的是我们也没有这个技术。所以Shazam的最初几个月都是花在找第四个人上面:那个技术专家,工程师,那个能够实现想法,能够破解嘈杂环境下音乐识别难题的那个人。我们去了施乐研究中心(Xerox PARC),去了麻省理工媒体实验室(MIT Media Lab),去了斯坦福大学音乐与声学计算机研究中心(Stanford University Centerfor Computer Research in Music and Acoustics)。在所有的这些地方,我们都仔细描述了这个想法,问问他们有没有人能够实现它。大部分情况都是,人们说:“哈哈,这是不可能的。你们毕业之后还是老老实实去麦肯锡之类的公司上班吧。”
如果我们坚持的话,人们又会说:“这个主意很棒,但是非常有挑战性,即使你们能做成,也需要能填满一个公园的计算机,单个搜索的成本就能有1美元或者2美元,你们是没法通过这个赚钱的。”我们公司的头三个月就是这样,一直都在设法寻找我们要找的那个人。
佩德罗桑托斯:你从众多候选人中选中了艾弗里的主要原因是什么?
克里斯巴顿:我们在网上做了很多研究。我们先找出了发表过数字信号处理方面论文的人,他们大多数都来自麻省理工或者斯坦福大学。然后我们就有了一个列表,菲利普和我一起整理了大概40个人的列表。之后我们找到了斯坦福大学教授朱利斯史密斯(Julius Smith)。名单上其他人大多数都是博士生或者最近毕业的博士。
我们很多次试着联系朱利斯,但一开始的几次他实际上都在无视我们。最终,因为我们有了来自伯克利的顾问丹伊利斯(Dan Ellis),他成了我们见到朱利斯的敲门砖。
最后朱利斯终于说:“好吧,既然丹伊利斯也参与了你们的项目,那我就跟你们聊聊。”接着我们去了位于帕罗奥图(Palo Alto)的斯坦福大学,在他家客厅里碰面。他对这个主意很满意,他说他也不知道当时有什么技术能够做到,但是他觉得发明这种技术是可行的。
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/shouji/article-78169-1.html
大发
疯了
不听话放出来就得下课