电竞比分网-中国电竞赛事及体育赛事平台

分享

AI幾分鐘生成的繪本,你敢給孩子讀嗎?

 刺猬公社 2025-10-29 發(fā)布于北京

教人用AI做繪本,一門新生意。


文|白棉
編|園長
2024年8月,一本標注為 AI 繪制的繪本《卡皮巴拉的自我修養(yǎng)》上架微信讀書,一度排到新書榜第5名。AI 發(fā)展到今天,使用文生圖技術和人工智能協(xié)同創(chuàng)作繪本,不是一件值得驚訝的事。
但近期,人們可以使用自然語言描述自己想要的故事,AI可以在一分鐘內迅速完成繪本。
今年夏天,Gemini 推出Nano banana 模型,憑借著出色的角色一致性能力,引發(fā)了眾多網友對 AI 圖像生成的探索和關注。在該模型曝光不久前,Gemini AI 上線了 Storybook 故事創(chuàng)作功能,用戶僅需輸入幾句話描述情節(jié),AI將自動生成10頁圖文內容的電子書。
圖像模型的完善使得人們逐漸開始探索AI繪本功能的妙用。在短視頻平臺上有大量 AI 繪本視頻,很多視頻附上英文字幕和配音,tag 標注為英語繪本、英語磨耳朵等,平均點贊量大幾千,有的視頻數(shù)據(jù)則近百萬。點開這些博主的主頁,往往掛著啟蒙繪本、英語繪本視頻合集等購買鏈接。
AI 一鍵生成的繪本能讀嗎?為什么這些略顯抽象的幻燈片放映似的視頻能迅速走紅?為了找到答案,我開始著手調研和試用產品。

成為繪本創(chuàng)作者,只要一分鐘

為了直觀體驗目前 AI 繪本技術的能力,我在 Google Gemini 里進行了一次測試。 點開AI繪本功能,界面上出現(xiàn)了幾個創(chuàng)作建議。 

我隨手點擊了第三個關于“小蜜蜂”的創(chuàng)意概述。等待時間不到一分鐘,一個可以翻頁的電子繪本呈現(xiàn)在我面前。 

繪本總共有十頁,講述了一個名叫巴奇的小蜜蜂的故事。盡管提示詞只有一個故事模糊的輪廓,但 AI 生成的故事邏輯是自洽的。講的是巴奇出門采蜜,遇到一個無精打采的小花,小蜜蜂采蜜后花兒重新抬起了頭,順暢地表明了蜜蜂活動有益。不過不得不承認,AI 生成的故事吸引力和趣味性不高,結構的“起承轉合”也不明顯,稱作“小故事大道理”更為合適。
之后我關注了一下“角色一致性”的問題,這是過去 AI 繪本制作的最大痛點。
在 Gemini 生成的故事里,主角巴奇的造型整體保持得不錯。雖然偶爾蜜蜂的造型和手的顏色會有些許出入,但完全沒有出現(xiàn)“角色突變”那種讓人詫異的硬傷。 如果對畫風不滿意,操作也很簡單。
現(xiàn)在漫畫的“大眼萌”風格略有恐怖谷風格,于是我接著要求 Gemini 更改風格,新的繪本很快也出爐了,整體畫風變?yōu)閷m崎駿動漫風。 

圖|新的風格 

除了點擊推薦的指令生成故事繪本,我們也可以“先文后圖”。我用 Gemini 的文字 AI 功能生成了一個全新的故事腳本,再點開 Storybook 功能進行創(chuàng)作。
經我人工鑒別,AI生成的圖畫與腳本內容還是非常一致的。 


|新的繪本 

在“一站式繪本”的功能上新之前,我也嘗試過使用多個大模型制作 AI 繪本,只能說需要一定的耐心。 
AI 創(chuàng)作繪本的核心是文生圖能力。從ChatGPT、DeepSeek等模型里拿到腳本,僅僅是第一步,最難的環(huán)節(jié),是將其“喂”給文生圖 AI。
如果一次性投喂長腳本,AI 的多圖能力不足,角色一致性較差,會發(fā)生“一人千面”,所以創(chuàng)作者需要將故事拆解成一頁一頁,反復修改提示詞,祈禱 AI 能穩(wěn)定發(fā)揮。如果還想要流暢的配音,更要多工具協(xié)同,調取一個音頻 AI。 
目前的模型“畫”得越來越快,并且正在解決一次性生成連續(xù)故事的問題。 
當然,“卷”故事繪本的不止谷歌。國內文生圖模型也陸續(xù)升級,改善多圖生成的一致性問題,在生成連續(xù)故事的功能上有所完善。例如,字節(jié)跳動近期發(fā)布的AI圖像生成模型 Seedream 4.0,稱其性能超越了谷歌的 Gemini 2.5 Flash Image,能一口氣免費輸出最多20張差異化圖像。這對批量生成 AI 繪本、視頻分鏡頭腳本等場景至關重要。 
我用相同的 prompt 進行了測試。該模型可以直接在豆包上使用,出圖質量和圖像穩(wěn)定性也有所保證,只是在部分復雜圖像中,角色形象不穩(wěn)定,人像和動物搖擺不定。

在這些“一站式平臺”出現(xiàn)之前,不少 AI 自媒體博主將該場景拆分,兜售“AI繪本制作教程”。他們教人如何結合 Midjourney 等圖像模型,再搭配 ChatGPT、剪映,拼湊出一個完整的繪本。但這個模式軟件切換繁瑣、流程冗長、出圖效果不穩(wěn)定、使用成本高昂,創(chuàng)作依舊復雜,想要擁有自己的繪本故事仍然困難。 
現(xiàn)在,只要給 AI 一個概述、大綱或腳本,它基本都能生成一個邏輯自洽的故事,并配上高度符合場景的圖片,這使得 AI 繪本領域出現(xiàn)了越來越多新的創(chuàng)意。

這個生意,賣的不是繪本

AI 繪本的生意不止一種,但其初始形式和所有新興 AI 技術一樣,源自于一種焦慮。

在社交平臺,大量自媒體博主打出“AI學習”的標簽,將AI繪本等技術作為“副業(yè)”的一部分。他們利用信息差,將精美的 AI 圖片發(fā)帖“引流”吸引關注,再轉化關注者為消費者,以19.9元的價格售賣文生圖 AI 的插畫提示詞或教程等。

此外,部分博主直接將“AI繪本生意”作為宣傳亮點,走的是 AI 賣課路線。

我嘗試聯(lián)系了一個社交媒體賬號,他們宣傳稱正在招募想要以 AI 繪本為副業(yè)的人。后來我加到一個企業(yè)微信號,對方自稱AI XX 老師”,發(fā)來鏈接和海報,當晚就需要上線聽AI繪畫技巧公開直播課。

在AI繪本的應用中,人們除了最初的嘗試,往往還有更具實用性的需求。例如短視頻平臺很火的英語繪本系列,主打的就是通過圖文結合的方式幫助孩子更快地記住特定單詞。

另外,孤獨癥等特殊需求群體也值得關注。2024世界人工智能大會上,阿里通義展示了關照孤獨癥兒童的 AI 繪本工具“追星星的 AI”。該工具可以生成常識認知、社交禮儀、心智解讀和趣味故事這四類內容的繪本,并可設置 3 個層級的認知水平。

在兒童教育領域,AI 繪本同樣是一項有力工具。圖文并茂的繪本可以激發(fā)小朋友的創(chuàng)造力和想象力,但目前市場上的傳統(tǒng)繪本在主題上相對趨同,難以滿足每一個家庭的需求。

在社交媒體上,很多帖子在求助給孩子看的繪本推薦,也有批判繪本價值觀充斥著刻板印象的避雷貼。一些家長希望孩子接觸性別平等等更廣闊的議題,擔憂市面上“總在贊美媽媽勤勞,夸獎爸爸勇敢”的繪本難以起到正確引導和教育作用。

AI 繪本產品出現(xiàn)后,許多不會畫插畫的普通人能將自己的想象力和創(chuàng)造力落地,創(chuàng)作出屬于自己孩子的定制繪本。

這一定制需求,自然成為目前 AI 繪本的重要發(fā)展方向。在某平臺,二十元一份的AI十頁繪本代做賣出超200份。AI 播客生成平臺 Listenhub 也開發(fā)了AI繪本產品,該產品的誕生來源于公司 CTO 自己的需求。孩子太喜歡聽故事,他便想到結合公司的 AI 音頻能力,加上各大前沿圖像模型,能夠一鍵演繹故事,制作出有聲繪本把想象傳遞給孩子。

AI+ 繪本產品童語故事開發(fā)者則是在一次和女兒去樂園游玩的經歷后,突發(fā)奇想將游玩的記錄變成了繪本。女兒很喜歡,還送給了同學讀,他之后便開發(fā)了這一繪本故事生成工具,提供給非專業(yè)內容創(chuàng)作者使用。

隨著一站式技術的完善,AI 繪本的生成更加便捷,人們的需求開始更加復雜和豐富。例如,Listenhub 支持電子翻頁繪本一鍵生成視頻繪本;在童語故事小程序創(chuàng)作繪本時,家長能夠在首頁看到其他創(chuàng)作者的作品,在流程中可以選擇孩子的年齡段,故事概要能使用 AI 推薦,畫面風格和角色也都有很多選項。如果家長的思考并不完善,相關功能可以給予提示和幫助。

這些產品被投射的關注,來自于人們對定制兒童繪本的需求,而不是繪本本身。家長想要看到“自己講述的故事”“孩子自己的故事”,在和 AI 的交互之中,那些獨一無二的繪本故事得以誕生。

這種需求也在揭示一個事實,AI 繪本的商業(yè)變現(xiàn)會開拓一種新的模式,和傳統(tǒng)繪本出版這條路并不相交。

專業(yè)插畫師 Dream 告訴刺猬公社,AI 生成的繪本目前是達不到出版社要求的。一本傳統(tǒng)繪本基礎頁數(shù)要求是32頁,制作周期一般要一到兩年。AI 繪本很精致,創(chuàng)作速度很快,但卻缺乏真實的表達;傳統(tǒng)繪本可能會在故事開頭的畫面適當留白,在高潮時配合豐富的畫面。繪本不只是文字與配圖放在一起,兩種表達會相互配合,帶給讀者童趣抑或是多元的感受,這背后的復雜創(chuàng)作是 AI 難以復制和展現(xiàn)的。

事實上,在紙媒下行的今天,繪本本身就不是一門“好生意”,許多插畫師都需依靠副業(yè)才能堅持創(chuàng)作。因此,AI 繪本生意的出現(xiàn)對傳統(tǒng)繪本行業(yè)反而沖擊較少。

多重因素疊加下,現(xiàn)在市場上用AI畫繪本不賺錢,真正賺錢的是“教人畫”以及“提供工具”。無論是賣19.9元的提示詞,還是收取會員費的一站式生成平臺,本質都是在售賣一種“能力”——一種在 AI 時代“人人皆可成為創(chuàng)作者”的能力,是家長們希望深度參與孩子成長的需求。

結語

不過,作為“定制的藝術”,AI 繪本功能仍有待完善。

目前市場上的文生圖模型已經可以做到對單個圖進行修改,保持一定的穩(wěn)定性。但無法對10頁的繪本里單獨的頁面進行刪改,必須重新從文字腳本和畫面描述進行修改。

我在實際操作中進行了嘗試。當我讓 Gemini 去掉第三頁的文本時,它干脆地拒絕了我,我又讓它修改封面時,它答應得爽快,但實際顯示的畫面并沒有改變。

除此之外,AI 繪本的核心使用場景是“兒童成長”,而它最大的風險,在于大模型的“黑盒問題”。和大模型合作創(chuàng)作內容時,模型背后的價值判斷很難察覺,這些 AI不是全然正確和沒有偏見的。

大模型是基于海量數(shù)據(jù)訓練的結果,數(shù)據(jù)中固有的不道德與偏見已經在訓練里自動形成。已有研究發(fā)現(xiàn),未經過規(guī)范的語言模型存在道德感缺失,在面臨簡單的日常情境倫理判斷問題時準確率僅有60.2%,這對兒童教育來說無疑存在風險。

每一個故事背后都暗含表達,無論是 AI 還是人類,敘述者的思考無法在故事里躲藏。在人機合作過程中,人類能否及時辨認不合理之處,也是一項不小的挑戰(zhàn)。

參考資料:

1.《ListenHub 視頻繪本,把每個人的想象都變成視頻故事》,有機大橘子。2025.9
2.《3秒出標題,15秒出簡介,30秒出一整本少兒繪本|專訪ImageStory》,視智未來,2023.9
3.《Can machines learn morality?The Delphi Experiment》,JIANG L W,HWANG J D,BHAGAVATULA C,2022:2110.

    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多