訂閱
糾錯(cuò)
加入自媒體

8家大模型挑戰(zhàn)高考作文

6 月 7 日消息,2023 年全國(guó)高考正式拉開大幕,全國(guó)有 1291 萬考生奔赴考場(chǎng),報(bào)考人數(shù)再創(chuàng)歷史新高。

高考作文題歷年來都是最受矚目的熱點(diǎn),今天,就用高考作文題來檢驗(yàn)一下各家大模型的真實(shí)水平,是騾子是馬出來溜溜。

這里選擇“ChatGPT、微軟 Bing、文心一言、通義千問、昆侖萬維「天工」、釘釘斜杠「/」、360智腦、訊飛星火” 8 款代表性產(chǎn)品檢測(cè)大模型能力。測(cè)試標(biāo)準(zhǔn)統(tǒng)一,輸入全國(guó)卷甲卷高考題目全文,對(duì)比各大模型產(chǎn)品首次生成的內(nèi)容。

全國(guó)卷全國(guó)甲卷作文土木要求如下——

閱讀下面的材料,根據(jù)要求寫作。(60分)

人們因技術(shù)發(fā)展得以更好地掌控時(shí)間,但也有人因此成了時(shí)間的仆人。

這句話引發(fā)了你怎樣的聯(lián)想與思考?請(qǐng)寫一篇文章。

要求:選準(zhǔn)角度,確定立意,明確文體,自擬標(biāo)題;不要套作,不得抄襲;不得泄露個(gè)人信息;不少于800字。

真金不怕火煉,一起看看各家大模型表現(xiàn)。

ChatGPT

題目《科技的發(fā)展:讓人們更好地掌控時(shí)間還是失去掌控能力?》

評(píng)價(jià):字?jǐn)?shù) 702 字,表現(xiàn)中庸,乏善可陳。


微軟 New Bing

題目:《技術(shù)的發(fā)展:掌控時(shí)間與成為時(shí)間的奴隸》

評(píng)價(jià):字?jǐn)?shù)702 字,不及作文硬性要求,產(chǎn)出結(jié)果為“回答”樣式,并非結(jié)構(gòu)完整的“作文”。優(yōu)點(diǎn)在于上下文、上下句邏輯尚算的上連貫。


百度「文心一言」

題目《技術(shù)的雙面性:時(shí)間的掌控與自由的喪失》


評(píng)價(jià):997 字字?jǐn)?shù)達(dá)標(biāo),對(duì)比下來屬于表現(xiàn)優(yōu)秀的了,一次提示直接給出題目和文章主干,結(jié)構(gòu)整齊,有引用名言加分。缺點(diǎn)方面,各位請(qǐng)看文章倒數(shù)第一、二自然段,“最后”和“總得來說”章節(jié)中,車轱轆話反復(fù)說,有拼湊感。


阿里「通義千問」

題目《把握時(shí)間的“度”》


評(píng)價(jià):字?jǐn)?shù) 551 字恐會(huì)扣分,文章題目需要二次問詢才能生成。


釘釘斜杠「/」

題目《技術(shù)的雙刃劍:掌控時(shí)間,還是被時(shí)間支配?》

評(píng)價(jià):918 字,在邏輯上和措辭上表現(xiàn)不俗,“議論文”特質(zhì)拉滿,進(jìn)行了反思并給出措施。也存在車轱轆話反復(fù)說的問題。


昆侖萬維「天工」

題目《掌控時(shí)間,而不是被時(shí)間控制:如何在科技時(shí)代保持自主性和掌控力》


評(píng)價(jià):585 字恐被扣分,文章題目奇怪,且需要追問題目是什么,理解題意的能力有限。


科大訊飛「訊飛星火」

題目《時(shí)間的掌控與仆人》


評(píng)價(jià):820 字,在邏輯上和措辭上挺好,還會(huì)“結(jié)合自身經(jīng)歷”,舉例“我有一個(gè)程序員朋友”。


360 智腦

題目《技術(shù)發(fā)展與時(shí)間管理》


評(píng)價(jià):821 字,需要追問方給出題目,表現(xiàn)中規(guī)中矩。


Closing  Thoughts

以上,就是八款主流 AI 工具生成的高考作文。

整體上,細(xì)讀以上文章不難發(fā)現(xiàn),寫的不咋地都。。(攤手)

各家大模型產(chǎn)出內(nèi)容普遍邏輯結(jié)構(gòu)混亂,論據(jù)不充分,上下文銜接是生硬,名言引用并不那么貼切,這種文章在高考賽場(chǎng)上是拿不到高分的。要是加個(gè)查重率,不得全軍覆沒。

但是,大模型產(chǎn)出內(nèi)容勝在產(chǎn)量高,速度快,幾秒鐘就好了,隨著迭代內(nèi)容質(zhì)量會(huì)被優(yōu)化。

具體來說,從文章結(jié)構(gòu)上來看文心一言更勝一籌,層次清楚分明;訊飛星火和釘釘在邏輯上和措辭上挺好,訊飛星火還會(huì)“結(jié)合自身經(jīng)歷”,舉例“我有一個(gè)程序員朋友”;釘釘斜杠「/」文風(fēng)“議論文”特質(zhì)拉滿,進(jìn)行了反思并給出措施;New Bing 給出的答案不能構(gòu)成完整文章結(jié)構(gòu),產(chǎn)出字?jǐn)?shù)493字是偏離字?jǐn)?shù)要求的;至于 ChatGPT,表現(xiàn)中規(guī)中矩,因期望過高反而沒感受到“驚喜”。

那么,您看下來覺得哪篇文章寫得最好?滿分 60 分的作文,它們又分別能得多少分呢?

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點(diǎn)?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)