国产精品亚洲欧美一区麻豆,国产在线精品无码不卡手机免费,国产福利无码一区色费

奢望AI寫作文？先把校對干好再說

2023-06-09 09:37

智商稅研究中心

關(guān)注

連高考作文都能寫，面對更簡單的校對工作，AI大模型能做好嗎？

高考開始后，除了考生之外，最忙碌的可能就是AI大模型們了，有人測試它寫高考作文，有人測試它解數(shù)學(xué)應(yīng)用，各家AI大模型，這幾天很忙。

十項全能的AI大模型，連高考考場都敢上，對于相對簡單的校對工作，是不是更不在話下？對此，不同的使用人群，有著不一樣的反饋。

今天，潘哥準(zhǔn)備進(jìn)行AI大比武，選取科大訊飛的訊飛星火、百度的文心一言、阿里的通義千問、360的360智腦、以及openAI的GPT4，看看同一文本下，這五家AI大模型，誰的校對能力最好。

一場碳基與硅基生物的較量，以及硅基生物之間的較量，即將在這里上演。

字詞校對可以嗎？

對于AI大模型來說，校對時最主要的工作，似乎就是發(fā)現(xiàn)錯別字。

對此，潘哥使用例句：“洛陽親友如相問，就說我在岳陽樓。”將“相問”故意錯拼成“翔問”，看看這個明顯錯誤，AI能不能發(fā)覺。

潘哥發(fā)現(xiàn)，在第一輪測試中，訊飛星火、文心一言、通義千問、GPT4，都準(zhǔn)確無誤地完成了工作；只有360智腦，潘哥對它連問兩次，都沒有發(fā)現(xiàn)其中錯誤。

在第二輪測試中，潘哥利用人們鍵盤打字時，容易拼錯、選錯的失誤，再次給AI挖了個坑。

潘哥的座右銘詩句：“我自橫刀向天笑，笑完我就去睡覺。睡醒我再拿起刀，我又橫刀向天笑。”將“睡醒”拼成“水醒”，看看AI能不能校對出來？

這一輪，勝出者只有GPT4；訊飛星火將“水醒”變成了“水星醒”，文心一言一字未改，通義千問和360智腦，都大幅改動了原句，其中360智腦的畫風(fēng)略驚悚。

鍵盤拼寫時出現(xiàn)的錯別字，已經(jīng)讓有些AI難以應(yīng)付，對于博大精深的成語，AI能否識別呢？

為此，潘哥選擇了一句發(fā)瘋文學(xué)：“每天上班早起，都有種魂飛魄散的感覺。”將其中的成語“魂飛魄散”，故意寫作“魂飛魂散”，等著AI跳坑。

潘哥發(fā)現(xiàn)，這一輪測試，360智腦、GPT4校對成功；訊飛星火將“魂飛魂散”，改成了“神游物外”；文心一言兩輪校對，都將前半句改成“每天早上都要早起上班”，可見其對上班怨念之深，后半句也給潘哥換了成語；通義千問兩輪校對中，則出現(xiàn)了精神分裂，第一次“如釋重負(fù)”，第二次卻“疲憊不堪”。

到這里，潘哥想給AI增加難度，將易拼錯、易寫錯、四字成語疊加在一起，看看AI如何應(yīng)對？

為此，潘哥使用喪氣文學(xué)：“有錢人終成眷屬，沒錢人親眼目睹，我獨自坐在路邊，看得清清楚楚。”將“清清楚楚”改成“青清楚楚”，

這輪測試中，訊飛星火、文心一言、GPT4，都輕松完成了工作；通義千問雖然改對了“清清楚楚”，但固執(zhí)地要把“親眼目睹”改成“只有干瞪眼”；360智腦則認(rèn)為句子無誤。

語病能否被發(fā)現(xiàn)？

僅僅讓AI發(fā)現(xiàn)錯別字，難度似乎還不夠，一個合格的校對人員，還應(yīng)看出文本中的語病。

眾所周知，漢字語序顛倒，有時并不影響閱讀。因此，潘哥選擇詩詞新作：“眾里尋他千百度，驀然回首，那人卻在床上穿秋褲。”將后半句語序打亂，變成“那人床上卻在穿秋褲”，看看AI能發(fā)現(xiàn)其中蹊蹺嗎？

可以看出，這輪的勝出者，只有GPT4一家；訊飛星火、文心一言都沒有發(fā)現(xiàn)任何錯誤；通義千問改對了語序，卻把“穿秋褲”的人放在了枕上，玩起了高難度動作；360智腦同樣改對了語序，卻畫蛇添足地加了一個“在”字，生成了另一個病句。

除了語序錯誤之外，文本校對過程中，還有些更為隱蔽的語病，沒看過《五年高考三年模擬》的AI，對此會怎么解？

為此，潘哥自創(chuàng)病句：“去年畢業(yè)的他，現(xiàn)在就職于一家公司的舔狗工作。”看看這道難題，AI大模型能做對嗎？

在這輪測試中，除了GPT4之外，另外四家AI全部折戟，文心一言更是把“舔狗”直接改成了“助理”；GPT4首輪似乎認(rèn)為“舔狗”二字不合規(guī)，被潘哥改成了“助理”之后，成功修改了語病。

具有明顯語病的句子，已經(jīng)讓AI感到吃力；對于帶有歧義的句子，AI能否辨別出來呢？

為此，潘哥寫下：“在床上‘葛優(yōu)癱’了一天，他突然想起來了。”看看這句帶有歧義的話，AI大模型能校對出來嗎？

這一輪測試，除了GPT4發(fā)現(xiàn)了其中歧義，其他四家AI再次校對失�。挥嶏w星火、360智腦對此表示無誤；文心一言將整個句子，重新改寫了一遍；通義千問則刪除了“葛優(yōu)”二字。

讓AI大模型在校對時，主動識別歧義句，潘哥覺得有難度有點大，如果讓AI直接判斷是否具有歧義，效果又會如何呢？

可以看出，在潘哥直接發(fā)問下，文心一言、通義千問、360智腦，都表示句子沒有歧義；訊飛星火指出了解讀歧義，但搞錯了造成歧義的原因；而濃眉大眼的GPT4，這次卻臨陣叛變，表示：“這句話沒有明顯的歧義”。

AI校對哪家強？

進(jìn)行了八輪測試后，潘哥發(fā)現(xiàn)，一些AI大模型，總喜歡在校對時，幫你改寫句子，比如在第三輪測試中，很多AI開始了自我發(fā)揮。

可以看出，除了GPT4之外，另外四家AI大模型，都對“魂飛魂散”這個錯字成語，進(jìn)行了替換。

對此，潘哥提示大家，在校對文本過程中，最好在下達(dá)命令前，就告訴AI大模型，不許對文本進(jìn)行改動；否則，AI很可能會放飛自我。

另一邊，AI校對出現(xiàn)錯誤后，如果我們對其進(jìn)行指正，對方能虛心接受嗎？對此，潘哥繼續(xù)采用第三輪測試文本，和AI進(jìn)行了對話。

潘哥發(fā)現(xiàn)，訊飛星火和GPT4，立刻接受了指正，文心一言先把話題岔開，對潘哥打起了感情牌，后來才改正了句子；通義千問和360智腦，雖然承認(rèn)了錯誤，但仍然沒有理解潘哥意思。

潘哥發(fā)現(xiàn)，openAI的GPT4，不僅能夠發(fā)現(xiàn)錯別字，還能發(fā)現(xiàn)語病甚至歧義句；不過，對于文本內(nèi)容的過度敏感，可能會讓其“罷工”，影響校對的效率。

另一邊，訊飛星火和文心一言，也能發(fā)現(xiàn)簡單的錯別字，并且能夠?qū)W習(xí)校對知識，如果持續(xù)訓(xùn)練一段時間，效果可能會有所提升。

通義千問和360智腦，在文本校對過程中，容易替用戶做主，出現(xiàn)修改句子的行為；同時，兩者都比較固執(zhí)己見，如果想用其進(jìn)行校對，恐怕還要再訓(xùn)練一段時間。

如今的AI大模型，在校對方面還有很多不足，一些復(fù)雜文本的校對工作，完全交給AI的話，可能并不讓人放心。

不過，各家AI大模型，都具有持續(xù)學(xué)習(xí)的能力，在不斷的升級迭代后，AI將會引起怎樣的變革，誰也不敢妄下斷言。

原文標(biāo)題 : 奢望AI寫作文？先把校對干好再說

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

登錄登錄即可訪問所有OFweek服務(wù)

用戶名/郵箱/手機：
密碼：
忘記密碼？
用其他賬號登錄： QQ | 微信 | 新浪微博

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞