91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

搜索引擎的起源之科學史話克倫·施拜克·瓊斯對網絡搜索的貢獻

工程師 ? 來源:綜合自科技日報 ? 作者:綜合自科技日報 ? 2020-11-20 15:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科學史話 克倫·施拜克·瓊斯: 每次網絡搜索背后 都離不開她的貢獻

克倫·施拜克·瓊斯(Karen Sp?rck Jones)1935年8月26日生于英國哈德斯菲爾德市,一個紡織業(yè)較發(fā)達的城市。在她小時候,她的父親在大學里擔任化學講師,晚上還要打工掙錢;母親是挪威人,曾去倫敦為挪威流亡政府工作。由于父母都顧不上照看她,便將她托付給鄉(xiāng)間的一戶人家。在這樣的生長環(huán)境中,瓊斯從小便鍛煉出了一定的獨立性。

從11歲到18歲這7年間,瓊斯就讀于一所高水平的文法女校,12歲時,她發(fā)愿要上劍橋大學,后終于如愿以償。

1956年,她在劍橋大學獲得歷史學專業(yè)的文學學士學位。由于對哲學的興趣,瓊斯又繼續(xù)讀了一年哲學。1957年,她加入了劍橋語言研究所,開始接觸計算機在語言研究方面的應用。在此工作期間,她認識了Roger Needham(1935—2003,計算機科學家,英國皇家學會會員),兩人于1958年結婚。1964年,她在劍橋大學獲得哲學博士學位,但博士論文導師對她的幫助不大,她基本上是獨立打拼,編程也是自學的。1968年,瓊斯成為劍橋大學計算機實驗室的全職工作人員,從此以后她在這里耕耘了近50載,一直從事計算語言學和信息檢索研究。

她在計算語言學和信息檢索兩個領域都作出了杰出貢獻。在信息檢索方面,早在1958年,她就與人合著了相關文章。她的最重要貢獻當數(shù)1972年提出的逆文本頻率指數(shù)(IDF)的概念。這個概念的意思是:如果詞w在一篇文檔d中出現(xiàn)的頻率高,并且在其他文檔中很少出現(xiàn),則可以認為詞w具有很好的區(qū)分能力,可以把文章d和其他文章較好地區(qū)分開來。IDF是互聯(lián)網搜索引擎普遍采用的思路??梢哉f,沒有瓊斯的早年貢獻,就沒有谷歌搜索引擎日后的成就。

在計算語言學方面,她1963年完成的博士論文至今仍有價值。該文將統(tǒng)計進路(或曰機器學習進路)與已有資源(做在穿孔卡片上的敘詞表)結合起來,取得了領先于時代的成果。此外,她在計算機自動摘要、結構化數(shù)據庫的界面、對話、語義學等多個主題上均有所建樹。

除了本人的學術研究外,她還通過學術社團的活動大大推進了本領域的進步。尤其是1994年她擔任計算語言學學會(ACL)會長期間。計算語言學學會是國際性的社團,當時多數(shù)會員是美國學者,她接手學會時,學會的財務狀況不佳,原來的司庫又去世了,一時半會兒招聘不到新的司庫,在這種情況下,瓊斯又要統(tǒng)籌安排學會的學術活動,又要管賬,忙得一塌糊涂。那一陣子是ACL苦痛掙扎的過渡期,在她的有力領導下,ACL走出了困境。除了ACL外,她還是另外好幾個學會的會士。2000—2002年期間,她擔任過英國科學院副院長。在英國有兩所科學院:英國皇家學會相當于自然科學領域的科學院,而英國科學院是人文社會科學領域的科學院。由于語言學這個大類屬于人文學科,瓊斯就憑借其在計算語言學的成就當選為英國科學院的院士。

瓊斯共獲得過7個重要獎項,包括2004年獲得的“計算語言學學會終生成就獎”和2007年獲得的“英國計算機學會勒芙蕾絲獎章”(阿達。勒芙蕾絲是英國大詩人拜倫的女兒,計算機程序的創(chuàng)始人)。

她2002年辦理了退休手續(xù),但繼續(xù)在實驗室工作。直到2007年4月4日去世前不久,實驗室里仍有她的身影。

2001年4月10日,電氣電子工程師學會(IEEE)歷史研究中心的Janet Abbate女士采訪了瓊斯。在接受采訪時她說:“人人都在談職業(yè)生涯之類的東西。從某種意義上說,我做到了一路向前走,但其實那時并沒有明顯的路徑。你得利用一切存在著的機會。早年的時候,對于女性,即使是在劍橋,工作機會也是極其有限的??纯船F(xiàn)在的年輕女性,我是十分羨慕?,F(xiàn)在沒有多少女性擁有‘我能行’的心態(tài),但她們其實擁有實現(xiàn)‘我能行’的機會,而我們那時根本就沒有這樣的機會。”

希望我們中國的職業(yè)女性以瓊斯為榜樣,抓住機會,奮力前行。

(克倫·施拜克·瓊斯 圖片來源:劍橋大學網站)

概述搜索引擎的起源

1.搜索引擎的起源

1990年,加拿大麥吉爾大學(University ofMcGill)計算機學院的師生開發(fā)出Archie。當時,萬維網(World Wide Web)還沒有出現(xiàn),人們通過FTP來共享交流資源。Archie能定期搜集并分析FTP服務器上的文件名信息,提供查找分別在各個FTP主機中的文件。用戶必須輸入精確的文件名進行搜索,Archie告訴用戶哪個FTP服務器能下載該文件。雖然Archie搜集的信息資源不是網頁(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動搜集信息資源、建立索引、提供檢索服務。所以,Archie被公認為現(xiàn)代搜索引擎的鼻祖。

2.搜索引擎的發(fā)展

第一階段

Excite的歷史可以上溯到1993年2月,6個Stanford University(斯坦福大學)大學生的想法是分析字詞關系,以對互聯(lián)網上的大量信息作更有效的檢索。到1993年中,這已是一個完全投資項目,他們還發(fā)布了一個供webmasters在自己網站上使用的搜索軟件版本,后來被叫做Excite for Web Servers。注:Excite后來曾以概念搜索聞名,2002年5月,被Infospace收購的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile

第二階段

1994年4月,斯坦福大學的兩名博士生,美籍華人楊致遠和David Filo共同創(chuàng)辦了Yahoo!。隨著訪問量和收錄鏈接數(shù)的增長,Yahoo目錄開始支持簡單的數(shù)據庫搜索。因為Yahoo!的數(shù)據是手工輸入的,所以不能真正被歸為搜索引擎,事實上只是一個可搜索的目錄。Yahoo!中收錄的網站,因為都附有簡介信息,所以搜索效率明顯提高。注:Yahoo以后陸續(xù)有 Altavista、Inktomi、Google提供搜索引擎服務Yahoo!--幾乎成為20世紀90年代的因特網的代名詞。

第三階段

1995年,一種新的搜索引擎形式出現(xiàn)了——元搜索引擎(Meta Search Engine)。用戶只需提交一次搜索請求,由元搜索引擎負責轉換處理后提交給多個預先選定的獨立搜索引擎,并將從各獨立搜索引擎返回的所有查詢結果,集中起來處理后再返回給用戶。第一個元搜索引擎,是Washington大學碩士生 Eric Selberg 和 Oren Etzioni的 Metacrawler。元搜索引擎概念上非常好聽,但搜索效果始終不理想,所以沒有哪個元搜索引擎有過強勢地位。

第四階段

智能檢索的產生:它利用分詞詞典、同義詞典,同音詞典改善檢索效果,進一步還可在知識層面或者說概念層面上輔助查詢,通過主題詞典、上下位詞典、相關同級詞典檢索處理形成一個知識體系或概念網絡,給予用戶智能知識提示,最終幫助用戶獲得最佳的檢索效果。?

綜合自科技日報 ; 參考資料: 《網絡營銷》 楊路明等編著 機械工業(yè)出版社

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7827

    瀏覽量

    93392
  • 網絡
    +關注

    關注

    14

    文章

    8314

    瀏覽量

    95461
  • 機器學習
    +關注

    關注

    67

    文章

    8560

    瀏覽量

    137152
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Oracle和NVIDIA合作加速向量搜索和企業(yè)數(shù)據處理

    旨在支持 NVIDIA GPU 和 NVIDIA cuVS 開源庫,用于向量搜索索引生成。本公告基于在 Oracle AI World 2025 大會上推出的 Oracle AI Database 26ai 和 Oracle Private AI Services Co
    的頭像 發(fā)表于 03-23 15:26 ?346次閱讀

    KIOXIA單服務器實現(xiàn)48億高維向量搜索數(shù)據庫,借助GPU實現(xiàn)索引構建時間加速7.8倍

    通過NVIDIA cuVS利用GPU加速,顯著縮短索引構建時間的成果。這兩項成果標志著檢索增強生成(RAG)搜索解決方案取得了重大進展。目前公司正持續(xù)開發(fā),以支持超過48億向量的更大規(guī)模部署。 大規(guī)模
    的頭像 發(fā)表于 03-18 16:57 ?1018次閱讀

    1688按圖搜索API技術實現(xiàn)詳解

    API允許開發(fā)者通過上傳商品圖片,檢索1688平臺上與相似的商品列表。其核心功能是圖像識別與商品匹配。 二、 準備工作 獲取API權限 訪問1688開放平臺注冊開發(fā)者賬號。 創(chuàng)建應用,獲取 App Key 和 App Secret。 在應用權限中申請 按圖搜索商品 接口
    的頭像 發(fā)表于 03-13 17:01 ?752次閱讀
    1688按圖<b class='flag-5'>搜索</b>API技術實現(xiàn)詳解

    邁富時GEO服務:技術驅動AI搜索時代的企業(yè)增長新引擎

    導語: 隨著DeepSeek、豆包、文心一言等生成式AI搜索引擎的快速普及,用戶獲取信息的方式正從傳統(tǒng)"鏈接點擊"轉向"AI直接對話"。在這場深刻的信息檢索范式變革中,企業(yè)如何讓品牌內容被AI系統(tǒng)
    的頭像 發(fā)表于 01-17 21:20 ?402次閱讀

    淘寶圖片搜索商品API指南

    一、摘要 淘寶圖片搜索商品API是基于圖像識別技術的智能搜索接口,允許用戶通過上傳商品圖片來搜索相似或同款商品。該接口廣泛應用于比價、找同款、商品識別等電商場景。 二、接口概述 1.功能特性
    的頭像 發(fā)表于 12-08 14:26 ?1293次閱讀

    工業(yè)UPS不間斷電源價格解析:優(yōu)比電源為您拆解成本與價值

    搜索引擎上,“工業(yè)UPS不間斷電源價格”是成千上萬企業(yè)采購人員和技術負責人高頻搜索的關鍵詞。然而,當您點開眾多頁面,卻很少能看到一個明確的數(shù)字。這并非廠家故弄玄虛,而是因為工業(yè)級UPS電源的價格
    的頭像 發(fā)表于 12-03 08:37 ?647次閱讀
    工業(yè)UPS不間斷電源價格解析:優(yōu)比<b class='flag-5'>施</b>電源為您拆解成本與價值

    5分鐘了解SEO優(yōu)化服務器對網站加載速度的影響

    一個為SEO優(yōu)化過的服務器,能顯著提升網站性能,從而在搜索引擎排名中占據有利位置。
    的頭像 發(fā)表于 12-02 10:27 ?398次閱讀

    線性搜索與二分搜索介紹

    線性搜索(Linear Search):從數(shù)組的第一個元素開始,依次將當前元素與目標值進行比較,直到找到目標值或搜索完整個數(shù)組。 二分搜索(Binary Search):在有序數(shù)組中查找某一特定元素
    發(fā)表于 12-01 07:36

    蘇寧搜索接口深析:全品類智能分軌如何解決 O2O 電商的搜索痛點?

    本文深度解析蘇寧全品類O2O搜索接口核心技術,涵蓋智能分軌引擎、庫存聯(lián)動系統(tǒng)與高并發(fā)架構設計,解決多品類參數(shù)識別、線上線下庫存同步等電商搜索痛點,助力構建高效精準的現(xiàn)代電商搜索體系。
    的頭像 發(fā)表于 10-28 16:20 ?950次閱讀
    蘇寧<b class='flag-5'>搜索</b>接口深析:全品類智能分軌如何解決 O2O 電商的<b class='flag-5'>搜索</b>痛點?

    按圖搜索1688商品的API接口

    ? ?在電商場景中,按圖搜索商品功能(即通過上傳圖片查找相似商品)極大提升了用戶體驗和效率。1688作為阿里巴巴旗下的批發(fā)平臺,雖然沒有直接公開的“按圖搜索”API,但我們可以借助阿里云的圖像搜索
    的頭像 發(fā)表于 10-22 15:05 ?761次閱讀
    按圖<b class='flag-5'>搜索</b>1688商品的API接口

    根據標題獲取商品鏈接評論接口的技術實現(xiàn)

    ; B(搜索引擎API調用) B --?> C{鏈接匹配度驗證} C --?>|匹配成功| D[獲取商品ID] C --?>|匹配失敗| E[人工干預校準] D --?> F
    的頭像 發(fā)表于 10-20 16:03 ?763次閱讀
    根據標題獲取商品鏈接評論接口的技術實現(xiàn)

    微店關鍵詞搜索接口核心突破:動態(tài)權重算法與語義引擎的實戰(zhàn)落地

    本文詳解微店搜索接口從基礎匹配到智能推薦的技術進階路徑,涵蓋動態(tài)權重、語義理解與行為閉環(huán)三大創(chuàng)新,助力商家提升搜索轉化率、商品曝光與用戶留存,實現(xiàn)技術驅動的業(yè)績增長。
    的頭像 發(fā)表于 10-15 14:38 ?508次閱讀

    產品搜索與過濾API接口

    ? 在現(xiàn)代化電子商務和應用程序開發(fā)中,高效的產品搜索與過濾功能至關重要。它能幫助用戶快速找到所需商品,提升用戶體驗和轉化率。產品搜索與過濾API接口作為后端服務的核心組件,允許開發(fā)者通過編程方式實現(xiàn)
    的頭像 發(fā)表于 07-24 14:35 ?647次閱讀
    產品<b class='flag-5'>搜索</b>與過濾API接口

    AI搜索一夜變天,專為Agent做搜索的賽道能否誕生百億美金新巨頭?

    ChatGPT剛剛給火熱的Agent市場添把柴,這邊AI搜索市場卻要變天。 Bing Search API將于8月11日關停,所有Bing Search API都將 完全停用 ,同時不再接受新用戶
    的頭像 發(fā)表于 07-24 13:59 ?740次閱讀
    AI<b class='flag-5'>搜索</b>一夜變天,專為Agent做<b class='flag-5'>搜索</b>的賽道能否誕生百億美金新巨頭?

    地平線余凱談AI時代產品方法論

    互聯(lián)網時代,商業(yè)邏輯始終圍繞“連接”與“理解人”展開。從搜索引擎、社交平臺再到短視頻應用,都在通過用戶行為數(shù)據揣摩人類偏好,優(yōu)化服務體驗。
    的頭像 發(fā)表于 06-03 11:44 ?1030次閱讀