AI 時代最重要的能力——判斷能力

YTY
0 評論 1173 瀏覽 5 收藏 10 分鐘

隨著 AI 技術(shù)的飛速發(fā)展,尤其是推理模型如 DeepSeek-R1 的出現(xiàn),AI 在日常生活和工作中的應(yīng)用越來越廣泛。然而,AI 輸出內(nèi)容的準確性和質(zhì)量卻引發(fā)了新的思考。本文將探討在 AI 時代,普通人如何通過提升判斷能力來有效評估 AI 輸出內(nèi)容的正確性和價值。

在 deepseek-R1 發(fā)布前,主流大模型是語言模型,大家使用的重點是如何調(diào)試 prompt 讓大模型輸出質(zhì)量更高的結(jié)果;deepseek-R1發(fā)布后,主流大模型變成了推理模型,AI 能夠做到根據(jù)你提問的內(nèi)容,先推理思考你的深層需求是什么,再根據(jù)推理的結(jié)果進行輸出,使得輸出的結(jié)果質(zhì)量大大提高。

這降低了普通人在日常工作生活中使用大模型的門檻,所以,現(xiàn)在提問方式已經(jīng)不再是限制普通人使用的瓶頸,你只要能詳細描述清楚自己想要什么,大概率可以得到看起來還不錯的答案。那么,現(xiàn)在的關(guān)鍵點是什么呢?

在提問門檻降低后,普通人現(xiàn)在需要重點關(guān)注的,其實是一個更難的能力——判斷能力。

一、判斷能力

大家經(jīng)常能聽到 AI 幻覺這個詞,就是大模型有時會編造它認為真實存在的信息,雖然粗看起來合理可信,但其實并不是真實的。因為大模型的底層邏輯是預(yù)測下一個詞出現(xiàn)的概率,既然是預(yù)測,就不會有100%的準確性。

另一方面,在得出一個結(jié)論的過程中,往往需要推理能力,高質(zhì)量的推理 = 明確的前提 + 嚴密的邏輯 + 可解釋的過程 + 對反例的考慮 + 有意義的結(jié)論。但 AI 在推理的每一個方面都容易出現(xiàn)「裂痕」,盡管 AI 可能說得頭頭是道,但它在邏輯連貫性、內(nèi)容真實性和推理可靠性等方面都存在明顯不足,也很難對其結(jié)論的來源進行有效追溯。

雖然目前大部分 AI 工具有「聯(lián)網(wǎng)搜索」功能,可以在輸出的內(nèi)容中標注參考的信息來源,但 AI 在對參考信息總結(jié)時也可能出錯,甚至標注的信息來源中根本沒有提到 AI 輸出的內(nèi)容。

因此,如何判斷 AI 輸出內(nèi)容的正確性以及質(zhì)量好壞就變成了現(xiàn)在普通人用好大模型的關(guān)鍵。

二、怎么判斷

判斷 AI 結(jié)果的正確性和質(zhì)量是稀缺性能力,只有知識儲備豐富,才能快速分辨。判斷力的本質(zhì)是「用系統(tǒng)對抗混沌」,通過知識體系搭建、思維工具武裝、持續(xù)實踐反饋,才能顯著提升這項能力。

但這個方式其實是一個漫長的提升過程,在沒有那么大量的知識儲備的情況下,比如面對不太熟悉的領(lǐng)域,短期內(nèi)我們應(yīng)該怎么做呢?有下面幾種方法。

1、分步拆解法

在我們提問后,AI 的回答角度一般會比較全面,但深度往往不夠,我們需要先根據(jù) AI 的回答將復雜問題拆解成多個子任務(wù),然后重新提問,再逐個判斷每個子任務(wù)的回答質(zhì)量。

比如讓 AI 撰寫一個行業(yè)的市場分析報告時,它一般會從行業(yè)概況、行業(yè)發(fā)展現(xiàn)狀、驅(qū)動因素分析、競爭格局分析、用戶畫像分析等方面去闡述,但每個方面提供的內(nèi)容都較少。信息量少的時候不僅難以判斷信息是否正確,而且使用價值很低。

因此,我們可以基于這份回答,把大問題進一步細化,比如分別讓 AI 針對行業(yè)發(fā)展歷程、競爭格局現(xiàn)狀等單獨分析,從而縮小問題和回答的范圍。

2、交叉驗證法

將問題分步拆解后,我們可以通過橫向和縱向的對比,來進一步驗證 AI 輸出的內(nèi)容的正確性。

一方面,我們可以使用多個 AI 工具來回答同一個問題,對比它們輸出的結(jié)果;另一方面,在一個 AI 工具中,把同一個問題用不同的方式再問一遍,看輸出的結(jié)果是否一致。

通過這種方式,找出這些回答中的共性和差異。共性的部分置信度較高,有差異的部分再去詳細了解原因是什么。

3、逆向提問法

在 AI 的內(nèi)容看上去有道理時,不妨試著問一句“反過來想,如果結(jié)論不成立,會發(fā)生什么?”或者“有沒有可能出現(xiàn)與這個觀點相反的情況?”,這個方法非常實用。這類逆向問題可以幫助我們測試 AI 推理是否穩(wěn)固,也有助于我們構(gòu)建對問題更全面的理解。

比如你讓 AI 給出一個行業(yè)下滑的原因,它列出幾點你覺得都挺合理。那你可以反問一句“如果這個行業(yè)還在增長,那可能說明了什么?”這能暴露 AI 是否只是表面羅列,而沒有真正理解因果關(guān)系。

4、追蹤異常點

在看 AI 輸出的內(nèi)容時,需要重點關(guān)注其中的非常規(guī)表述和模糊的部分,尤其涉及數(shù)據(jù)、事實、專業(yè)術(shù)語、引用相關(guān)的部分,要重點核查來源和推理過程,這是 AI 最容易出錯的部分。

追蹤異常點其實就是在練習“質(zhì)疑意識”,當你覺得某個點“怪怪的”,不要放過它,而是去把它變成新的問題繼續(xù)追問。這種方式有兩個好處:一是可以幫助你識別 AI 在推理過程中的邏輯斷裂或偽裝出的“貌似合理”;二是可以逼迫 AI 補全它本來跳過或模糊帶過的內(nèi)容,輸出的質(zhì)量也會隨之提高。

久而久之,你會形成一種“異常點雷達”,自動對看似正常但實則不可靠的段落起疑。這在使用 AI 做研究、寫方案、甚至做決策輔助時,都是非常核心的能力。

總之,使用 AI 與讀書時的注意事項其實有異曲同工之處,盡信書,則不如無書。掌握了這些基本的方法,在不同領(lǐng)域你都可以快速拆解和評估 AI 的內(nèi)容質(zhì)量。

三、AI 的價值

從上文的描述中可以看出,我們要對 AI 推理的質(zhì)量好壞打一個問號,需要花精力去判斷。你對某個領(lǐng)域了解越深,就越能快速判斷 AI 輸出的內(nèi)容質(zhì)量。但反過來說,知識儲備越多,你可能也越不需要 AI 來幫你生成內(nèi)容。

所以可能存在這樣一個悖論,我們需要用 AI 的部分,判斷輸出內(nèi)容質(zhì)量很困難,而判斷起來容易的部分,可能根本不需要使用 AI。那么 AI 的價值在哪里呢?

盡管 AI 存在著這樣或那樣的問題,但你只要會提問,它就可以根據(jù)你的想法快速生成很多內(nèi)容,你可以低成本的獲得大量信息,這可以產(chǎn)生大量的可能性。

因此,AI 的最大價值就在于,它讓試錯的成本變得極低,從一個點子直通實踐,我們可以快速產(chǎn)生各種假設(shè),然后通過實踐來驗證、迭代,找到其中的最優(yōu)解。這種快速的實踐和迭代,才是我們使用 AI 的正確方式。

盡管 AI 的能力確實越來越強,但未來,不是 AI 替我們工作,而是我們學會更好地和 AI 合作。未來的人機協(xié)作模式很可能會變成——人類負責方向把控和價值判斷,AI 來承擔信息整合與模式挖掘的部分,最終實現(xiàn) 1+1>2 的效果。

我們需要記住的是,可以讓 AI 作為一個助手,一定不要讓 AI 替你決策,決策權(quán)還是在你自己這里。

本文由人人都是產(chǎn)品經(jīng)理作者【YTY】,微信公眾號:【產(chǎn)品二三】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!