Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

據彭博社最新報導,軟銀集團旗下的願景基金 2 號,即將投資美國人工智慧初創公司 Perplexity AI。

知情人士透露,軟銀的這次投資金額為 1000 萬至 2000 萬美元,而 Perplexity 本輪的融資總額也超過了 2.5 億美元。

這輪融資預計會讓 Perplexity 的估值提高三倍,可能達到 25 億至 30 億美元,將使其成為業內估值最高的公司之一。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

Perplexity 的目標是利用人工智慧與 Google 搜索展開競爭。

作為一家初創獨角獸公司,他們的核心服務是提供一個「答案引擎」,這與傳統的搜尋引擎有著本質的區別。

用戶不需要通過多個結果來尋找自己的問題的主要來源,而是直接獲得 Perplexity 為你找到的答案。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

Aravind Srinivas 曾經是 OpenAI 的一名研究科學家。在離開 OpenAI 後,他於 2022 年 8 月創立了 Perplexity。

Perplexity 想要為用戶提供快速、准確的答案,而無需用戶在海量信息中自行篩選。

Aravind Srinivas 在接受 The Verge 采訪時,也同樣說到:

我們關心的是真實性和准確性。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

作為「世界上首個對話式答案引擎」, Perplexity 回答界面十分干淨。在結果頁面,上方是信息來源,中間是答案,下面是延伸問題。

其獨特之處在於將 ChatGPT 式的問答和傳統搜尋引擎的連結列表相結合,開創出了一種全新的搜索體驗。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

早前在接受 Wired 采訪時,黃仁勛說自己「一直在用 Perplexity」。

當然,他也覺得 ChatGPT 挺好。在采訪時,黃仁勛尤其對計算機輔助藥物發現領域感興趣,他「差不多每天都用這兩個」來做調研:

或許說,你想了解計算機輔助藥物發現領域的進展。
那你得先圍繞這個話題來建一個框架,然後從那個框架問些更具體的問題。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

盡管 Perplexity 的商業模式在理論上具有吸引力,但其作為中間者的角色,可能會引發一些內容創作者的擔憂。

與 Arc Search 和 Google Gemini 一樣,在搜索問題後,Perplexity 也是直接提供答案結果。

如果這樣做,就必定會影響原始內容網站的流量和廣告收入。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

像 Google 和百度這樣的傳統搜尋引擎,其大部分資料都是爬蟲自動抓取的,以便於用戶通過關鍵詞進行搜索。

爬蟲可以迅速檢索並整理網站的信息,但它不會無腦抓取所有內容。網站一般在建立時,會設定一個 Robots 協議文件(也即 robots.txt)。

通過這個文件,網站就可以告訴搜尋引擎的爬蟲:哪些網頁可以抓取,哪些不可以。這是一種非強制性的協議,主要依賴於爬蟲開發者的遵守。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

大多數搜尋引擎和爬蟲開發者都會尊重 Robots 協議,不會抓取那些網站明確禁止抓取的內容。這樣做是為了尊重網站的隱私和版權,同時也是為了避免法律問題。

如果不遵守這個協議,那麼爬蟲就會強行訪問網站的內容。這樣做帶來的另一個結果,就是一些網站的付費牆可能會失效。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

在前不久,有人在使用 Perplexity 時,嘗試讓其總結關於埃里克•施密特(Eric Schmidt)秘密無人機項目。

然而,在 Perplexity 給出的結果中,可以看到里面有幾個片段是從 Forbes 的獨家報導摘取而來的,而且還給出了 Forbes 創作的一張原創插圖。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

後來 Forbes 也主動嘗試用 Perplexity 生成內容,在經過對多篇文章主題檢索後,他們發現自家文本內容經常會出現在 Perplexity 給出的答案中。

其中,有很多文章是帶有付費牆的獨家報導。Perplexity 繞過了 Forbes 的付費牆,未經授權使用了許多原創圖片和文本。

不光如此,Perplexity 給出的答案正文中也沒有出現資料來源。唯一的署名是一些可以連結到這些媒體的圖標,但是它們都非常小且容易被忽略

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

除了 Forbes,另一家著名媒體 Wired 也在控訴 Perplexity。

Wired 在早前寫了一篇關於 Perplexity 的文章,同樣報導了 Perplexity 在試圖使用爬蟲那些被阻止訪問的網站內容。

但後來,奇葩的事情出現了:Perplexity「盜用」了 Wired 的這篇文章 —— 盡管這篇文章是關於它自身的,而且 Wired 在其網站的相關文件中也明確阻止了 Perplexity 訪問。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

Wired 的開發人員 Robb Knight 對後台數據進行了研究。

在大量分析後,Wired 確定了一個有很大機率與 Perplexity 相關的特定 IP 地址,而且這個地址並不在 Perplexity 的公開 IP 范圍內。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

為了平息內容創作網站的情緒,Perplexity 的首席商務官 Dmitry Shevelenko 在接受 Semafor 采訪時表示,Perplexity 正在與出版商開發收入共享計劃。

Perplexity 尚未公布這些合作夥伴相關的細節,但 Dmitry Shevelenko 稱會盡快公布其計劃。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

Aravind Srinivas 也在接受 Fast Company 的采訪時回應了這一問題:

事實上,Perplexity 並沒有忽視 robots.txt,它只是使用了忽視它的第三方抓取器。

不過,Aravind Srinivas 拒絕透露第三方抓取器的名稱,也沒有承諾會要求該抓取器停止違反 robots.txt。

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

如果嘗試向 Perplexity 詢問:「作為一個 AI 搜尋引擎,你如何看待未經授權就引用他人文章?」

它會給出如下回答:

Perplexity AI 再獲巨額融資,但同時又深陷「剽竊風波」

看來 Perplexity 自己也知道,這樣做在一定程度上是有風險且不合法的。

就拿新聞業來說,如果你要寫一篇新文章,你會怎麼做?
你會說「據《紐約時報》報導」,也就是引用別人的話。這也正是我們在做的事情。

Perplexity 執行長 Dmitry Shevelenko 如此說到。

無論如何,還是希望 Perplexity 可以在合規的前提下,能繼續創造出更有想法的 AI 工具。

來源:愛范兒