【原】AI幾分鐘生成的繪本，你敢給孩子讀嗎？

刺猬公社 2025-10-29 發(fā)布于北京

展開全文

教人用AI做繪本，一門新生意。

文｜白棉

編｜園長

2024年8月，一本標注為 AI 繪制的繪本《卡皮巴拉的自我修養(yǎng)》上架微信讀書，一度排到新書榜第5名。AI 發(fā)展到今天，使用文生圖技術和人工智能協(xié)同創(chuàng)作繪本，不是一件值得驚訝的事。

但近期，人們可以使用自然語言描述自己想要的故事，AI可以在一分鐘內迅速完成繪本。

今年夏天，Gemini 推出Nano banana 模型，憑借著出色的角色一致性能力，引發(fā)了眾多網友對 AI 圖像生成的探索和關注。在該模型曝光不久前，Gemini AI 上線了 Storybook 故事創(chuàng)作功能，用戶僅需輸入幾句話描述情節(jié)，AI將自動生成10頁圖文內容的電子書。

圖像模型的完善使得人們逐漸開始探索AI繪本功能的妙用。在短視頻平臺上有大量 AI 繪本視頻，很多視頻附上英文字幕和配音，tag 標注為英語繪本、英語磨耳朵等，平均點贊量大幾千，有的視頻數(shù)據(jù)則近百萬。點開這些博主的主頁，往往掛著啟蒙繪本、英語繪本視頻合集等購買鏈接。

AI 一鍵生成的繪本能讀嗎？為什么這些略顯抽象的幻燈片放映似的視頻能迅速走紅？為了找到答案，我開始著手調研和試用產品。

成為繪本創(chuàng)作者，只要一分鐘

為了直觀體驗目前 AI 繪本技術的能力，我在 Google Gemini 里進行了一次測試。點開AI繪本功能，界面上出現(xiàn)了幾個創(chuàng)作建議。

我隨手點擊了第三個關于“小蜜蜂”的創(chuàng)意概述。等待時間不到一分鐘，一個可以翻頁的電子繪本呈現(xiàn)在我面前。

繪本總共有十頁，講述了一個名叫巴奇的小蜜蜂的故事。盡管提示詞只有一個故事模糊的輪廓，但 AI 生成的故事邏輯是自洽的。講的是巴奇出門采蜜，遇到一個無精打采的小花，小蜜蜂采蜜后花兒重新抬起了頭，順暢地表明了蜜蜂活動有益。不過不得不承認，AI 生成的故事吸引力和趣味性不高，結構的“起承轉合”也不明顯，稱作“小故事大道理”更為合適。

之后我關注了一下“角色一致性”的問題，這是過去 AI 繪本制作的最大痛點。

在 Gemini 生成的故事里，主角巴奇的造型整體保持得不錯。雖然偶爾蜜蜂的造型和手的顏色會有些許出入，但完全沒有出現(xiàn)“角色突變”那種讓人詫異的硬傷。如果對畫風不滿意，操作也很簡單。

現(xiàn)在漫畫的“大眼萌”風格略有恐怖谷風格，于是我接著要求 Gemini 更改風格，新的繪本很快也出爐了，整體畫風變?yōu)閷m崎駿動漫風。

圖｜新的風格

除了點擊推薦的指令生成故事繪本，我們也可以“先文后圖”。我用 Gemini 的文字 AI 功能生成了一個全新的故事腳本，再點開 Storybook 功能進行創(chuàng)作。

經我人工鑒別，AI生成的圖畫與腳本內容還是非常一致的。

圖｜新的繪本

在“一站式繪本”的功能上新之前，我也嘗試過使用多個大模型制作 AI 繪本，只能說需要一定的耐心。

AI 創(chuàng)作繪本的核心是文生圖能力。從ChatGPT、DeepSeek等模型里拿到腳本，僅僅是第一步，最難的環(huán)節(jié)，是將其“喂”給文生圖 AI。

如果一次性投喂長腳本，AI 的多圖能力不足，角色一致性較差，會發(fā)生“一人千面”，所以創(chuàng)作者需要將故事拆解成一頁一頁，反復修改提示詞，祈禱 AI 能穩(wěn)定發(fā)揮。如果還想要流暢的配音，更要多工具協(xié)同，調取一個音頻 AI。

目前的模型“畫”得越來越快，并且正在解決一次性生成連續(xù)故事的問題。

當然，“卷”故事繪本的不止谷歌。國內文生圖模型也陸續(xù)升級，改善多圖生成的一致性問題，在生成連續(xù)故事的功能上有所完善。例如，字節(jié)跳動近期發(fā)布的AI圖像生成模型 Seedream 4.0，稱其性能超越了谷歌的 Gemini 2.5 Flash Image，能一口氣免費輸出最多20張差異化圖像。這對批量生成 AI 繪本、視頻分鏡頭腳本等場景至關重要。

我用相同的 prompt 進行了測試。該模型可以直接在豆包上使用，出圖質量和圖像穩(wěn)定性也有所保證，只是在部分復雜圖像中，角色形象不穩(wěn)定，人像和動物搖擺不定。

在這些“一站式平臺”出現(xiàn)之前，不少 AI 自媒體博主將該場景拆分，兜售“AI繪本制作教程”。他們教人如何結合 Midjourney 等圖像模型，再搭配 ChatGPT、剪映，拼湊出一個完整的繪本。但這個模式軟件切換繁瑣、流程冗長、出圖效果不穩(wěn)定、使用成本高昂，創(chuàng)作依舊復雜，想要擁有自己的繪本故事仍然困難。

現(xiàn)在，只要給 AI 一個概述、大綱或腳本，它基本都能生成一個邏輯自洽的故事，并配上高度符合場景的圖片，這使得 AI 繪本領域出現(xiàn)了越來越多新的創(chuàng)意。

這個生意，賣的不是繪本
AI 繪本的生意不止一種，但其初始形式和所有新興 AI 技術一樣，源自于一種焦慮。
在社交平臺，大量自媒體博主打出“AI學習”的標簽，將AI繪本等技術作為“副業(yè)”的一部分。他們利用信息差，將精美的 AI 圖片發(fā)帖“引流”吸引關注，再轉化關注者為消費者，以19.9元的價格售賣文生圖 AI 的插畫提示詞或教程等。
此外，部分博主直接將“AI繪本生意”作為宣傳亮點，走的是 AI 賣課路線。
我嘗試聯(lián)系了一個社交媒體賬號，他們宣傳稱正在招募想要以 AI 繪本為副業(yè)的人。后來我加到一個企業(yè)微信號，對方自稱“AI XX 老師”，發(fā)來鏈接和海報，當晚就需要上線聽AI繪畫技巧公開直播課。
在AI繪本的應用中，人們除了最初的嘗試，往往還有更具實用性的需求。例如短視頻平臺很火的英語繪本系列，主打的就是通過圖文結合的方式幫助孩子更快地記住特定單詞。
另外，孤獨癥等特殊需求群體也值得關注。2024世界人工智能大會上，阿里通義展示了關照孤獨癥兒童的 AI 繪本工具“追星星的 AI”。該工具可以生成常識認知、社交禮儀、心智解讀和趣味故事這四類內容的繪本，并可設置 3 個層級的認知水平。
在兒童教育領域，AI 繪本同樣是一項有力工具。圖文并茂的繪本可以激發(fā)小朋友的創(chuàng)造力和想象力，但目前市場上的傳統(tǒng)繪本在主題上相對趨同，難以滿足每一個家庭的需求。
在社交媒體上，很多帖子在求助給孩子看的繪本推薦，也有批判繪本價值觀充斥著刻板印象的避雷貼。一些家長希望孩子接觸性別平等等更廣闊的議題，擔憂市面上“總在贊美媽媽勤勞，夸獎爸爸勇敢”的繪本難以起到正確引導和教育作用。
AI 繪本產品出現(xiàn)后，許多不會畫插畫的普通人能將自己的想象力和創(chuàng)造力落地，創(chuàng)作出屬于自己孩子的定制繪本。
這一定制需求，自然成為目前 AI 繪本的重要發(fā)展方向。在某平臺，二十元一份的“AI十頁繪本代做”賣出超200份。AI 播客生成平臺 Listenhub 也開發(fā)了AI繪本產品，該產品的誕生來源于公司 CTO 自己的需求。孩子太喜歡聽故事，他便想到結合公司的 AI 音頻能力，加上各大前沿圖像模型，能夠一鍵演繹故事，制作出有聲繪本把想象傳遞給孩子。
AI+ 繪本產品童語故事開發(fā)者則是在一次和女兒去樂園游玩的經歷后，突發(fā)奇想將游玩的記錄變成了繪本。女兒很喜歡，還送給了同學讀，他之后便開發(fā)了這一繪本故事生成工具，提供給非專業(yè)內容創(chuàng)作者使用。
隨著一站式技術的完善，AI 繪本的生成更加便捷，人們的需求開始更加復雜和豐富。例如，Listenhub 支持電子翻頁繪本一鍵生成視頻繪本；在童語故事小程序創(chuàng)作繪本時，家長能夠在首頁看到其他創(chuàng)作者的作品，在流程中可以選擇孩子的年齡段，故事概要能使用 AI 推薦，畫面風格和角色也都有很多選項。如果家長的思考并不完善，相關功能可以給予提示和幫助。
這些產品被投射的關注，來自于人們對定制兒童繪本的需求，而不是繪本本身。家長想要看到“自己講述的故事”“孩子自己的故事”，在和 AI 的交互之中，那些獨一無二的繪本故事得以誕生。
這種需求也在揭示一個事實，AI 繪本的商業(yè)變現(xiàn)會開拓一種新的模式，和傳統(tǒng)繪本出版這條路并不相交。
專業(yè)插畫師 Dream 告訴刺猬公社，AI 生成的繪本目前是達不到出版社要求的。一本傳統(tǒng)繪本基礎頁數(shù)要求是32頁，制作周期一般要一到兩年。AI 繪本很精致，創(chuàng)作速度很快，但卻缺乏真實的表達；傳統(tǒng)繪本可能會在故事開頭的畫面適當留白，在高潮時配合豐富的畫面。繪本不只是文字與配圖放在一起，兩種表達會相互配合，帶給讀者童趣抑或是多元的感受，這背后的復雜創(chuàng)作是 AI 難以復制和展現(xiàn)的。
事實上，在紙媒下行的今天，繪本本身就不是一門“好生意”，許多插畫師都需依靠副業(yè)才能堅持創(chuàng)作。因此，AI 繪本生意的出現(xiàn)對傳統(tǒng)繪本行業(yè)反而沖擊較少。
多重因素疊加下，現(xiàn)在市場上用AI畫繪本不賺錢，真正賺錢的是“教人畫”以及“提供工具”。無論是賣19.9元的提示詞，還是收取會員費的一站式生成平臺，本質都是在售賣一種“能力”——一種在 AI 時代“人人皆可成為創(chuàng)作者”的能力，是家長們希望深度參與孩子成長的需求。

結語
不過，作為“定制的藝術”，AI 繪本功能仍有待完善。
目前市場上的文生圖模型已經可以做到對單個圖進行修改，保持一定的穩(wěn)定性。但無法對10頁的繪本里單獨的頁面進行刪改，必須重新從文字腳本和畫面描述進行修改。
我在實際操作中進行了嘗試。當我讓 Gemini 去掉第三頁的文本時，它干脆地拒絕了我，我又讓它修改封面時，它答應得爽快，但實際顯示的畫面并沒有改變。
除此之外，AI 繪本的核心使用場景是“兒童成長”，而它最大的風險，在于大模型的“黑盒問題”。和大模型合作創(chuàng)作內容時，模型背后的價值判斷很難察覺，這些 AI不是全然正確和沒有偏見的。
大模型是基于海量數(shù)據(jù)訓練的結果，數(shù)據(jù)中固有的不道德與偏見已經在訓練里自動形成。已有研究發(fā)現(xiàn)，未經過規(guī)范的語言模型存在道德感缺失，在面臨簡單的日常情境倫理判斷問題時準確率僅有60.2%，這對兒童教育來說無疑存在風險。
每一個故事背后都暗含表達，無論是 AI 還是人類，敘述者的思考無法在故事里躲藏。在人機合作過程中，人類能否及時辨認不合理之處，也是一項不小的挑戰(zhàn)。

參考資料：
1.《ListenHub 視頻繪本，把每個人的想象都變成視頻故事》，有機大橘子。2025.9

2.《3秒出標題，15秒出簡介，30秒出一整本少兒繪本｜專訪ImageStory》，視智未來，2023.9

3.《Can machines learn morality？The Delphi Experiment》，JIANG L W，HWANG J D，BHAGAVATULA C，2022：2110.

贊賞

共11人贊賞

电竞比分网-中国电竞赛事及体育赛事平台

【原】AI幾分鐘生成的繪本，你敢給孩子讀嗎？

成為繪本創(chuàng)作者，只要一分鐘

這個生意，賣的不是繪本

結語

結語

【原】AI幾分鐘生成的繪本，你敢給孩子讀嗎？

成為繪本創(chuàng)作者，只要一分鐘

這個生意，賣的不是繪本