紙とタブレットのマンガをfMRIで比較した研究、統合問題の反応時間がタブレット条件だけ伸びた

「紙のマンガのほうが脳にいい」と直結させる話ではない。
今回のITmedia Newsの記事の元になったPLOS One論文は、紙か電子かの好みの話ではなく、物語の前半をどの媒体で読んだかが、その後の文脈統合に残るかを見た実験だ。

論文名はManga reading on paper vs. digital devices。
東京大学大学院総合文化研究科の酒井邦嘉教授らのチームが、コアミックスとの共同研究として発表している。
東大の発表では「省エネ化」という言葉を使っているが、同じ発表内で、脳活動の上昇をそのまま「脳によい」と評価する表現は科学的に不正確だとも釘を刺している。

タブレット条件だけSet 2の反応時間が伸びた

実験参加者は大学生・大学院生25人。
同じ物語を複数人物の視点から描く「ザッピングストーリー」形式のマンガを使い、各話の前半をMRI装置に入る前に紙の本またはタブレットで読ませる。
後半はどちらの条件でも、MRI装置内のLCDゴーグルで読む。

タブレットをMRI装置へ持ち込めないため、後半の読書環境はそろえた設計になっている。
紙とタブレットの前半は、画面の大きさや明るさをそろえ、タブレット側はタッチで画面が瞬時に切り替わる条件だった。

問題は2種類ある。
Set 1は前半だけで答えられる問題。
Set 2は前半と後半の情報を統合しないと答えられない問題。
正答率に有意差は出なかった一方で、タブレットで前半を読んだ条件だけSet 2の反応時間が長くなった。

実験の流れを図にすると次のようになる。前半の媒体だけが操作され、後半とテストは両条件で共通の環境にそろえてある。

flowchart TD
    A[前半を読む<br/>媒体を操作] --> B[紙の本で読む]
    A --> C[タブレットで読む]
    B --> D[後半をMRI内ゴーグルで読む<br/>両条件で共通]
    C --> D
    D --> E[Set 1の問題<br/>前半だけで解ける]
    D --> F[Set 2の問題<br/>前後半の統合が必要]
    E --> G[正答率は媒体差なし]
    F --> H[タブレット条件だけ<br/>反応時間が伸びた]

条件と結果を整理すると次の表になる。

観点	紙で前半を読んだ条件	タブレットで前半を読んだ条件
Set 1（前半だけで解ける）正答率	媒体差なし	媒体差なし
Set 2（前後半の統合）正答率	媒体差なし	媒体差なし
Set 2の反応時間	Set 1から伸びない	Set 1より有意に伸びた
後半読書中の左言語野の活動	小さい	大きい
後半読書中の右海馬・右紡錘状回	出ない	追加で活動
解答時の左言語野の活動	大きい	大きい

研究が示したのは「電子だと理解できない」ではない。
正答率には媒体差が出ていない。
ただし前半と後半をつないで理解する問題で、タブレット条件は答えにたどり着くまでの時間が長くなった。

ここで「反応時間が伸びた」「脳活動が大きい」が何を意味するかを先に押さえておく。

fMRI（機能的磁気共鳴画像法）は、脳のどこが働いているかを血流の変化から推定する手法だ。
神経細胞が活発に働くと、その場所で酸素を多く含む血液の割合が変わる。
この変化（BOLD信号、blood-oxygen-level-dependent）をMRIで撮り、課題中に強く反応した領域を「賦活した（活動が大きい）」と表現する。
つまり「脳活動が大きい」は頭の良し悪しではなく、その処理にどれだけ神経リソースを動員したかのおおまかな目安になる（あくまで血流を介した間接的な指標で、神経活動そのものの量ではない）。

反応時間（RT）は、問題が出てからボタンで答えるまでの時間だ。
正答率が同じでも反応時間が長ければ、答えにたどり着くまでに余分な処理ステップが挟まったと解釈できる。
今回の「タブレット条件だけSet 2で反応時間が伸びた」は、答えは合っていても統合のために回り道をした、という読み方になる。

省エネ化は処理が減った場所の話

fMRIでは、後半読書時と問題解答時の脳活動も比べている。
問題解答時には、紙条件でもタブレット条件でも左脳の言語野が強く活動した。
一方で後半のマンガ読書時は、タブレット条件では同じような活動が見られ、紙条件ではその活動が小さかった。

東大の発表は、この差を「前半の内容を紙の本を通して理解することで、後半の読書時に言語野の活動が節約された」と説明している。
さらにSet 1とSet 2を分けると、紙条件では前半だけで答えられるSet 1のときに右前頭葉の補助的な活動も小さく出た。

この「活動が小さい」は、電池持ちのよいデバイスのような意味ではない。
コアミックスの会見レポートも、「省エネ化」は余分な活動を抑えることを指し、効率化や利便性とは別だと説明している。
紙と電子で「思考の深さ」自体が変わるという結果は、この実験からは出ていない。

電子書籍側で見るならページ位置と戻りやすさ

研究チームは、紙の利点として安定した空間的・触覚的な手がかりを挙げている。
紙の本では、前に読んだ場面が「この辺のページ」「右側の下あたり」のように残りやすい。
複雑な伏線や人物視点を追う読み方では、この手がかりが前後の情報をつなぐ助けになる。

電子書籍の設計に引き寄せるなら、単に解像度やページめくり速度の話にはとどまらない。
読者が前の場面へ戻るとき、どの位置に何があったかを思い出せるか。
見開き、ページ番号、サムネイル、読書履歴、しおり、戻る操作が、物語の記憶を邪魔しないか。
今回の研究から直接プロダクト要件を引くなら、そのあたりになる。

そのままスマホの縦スクロール漫画やWebtoonの評価に直結させるのも飛躍がある。
実験で使われたのは、紙とタブレットで条件をそろえたマンガ本形式で、後半はLCDゴーグルで読ませている。
縦スクロール作品は、ページ位置の代わりにスクロール距離や連続表示が手がかりになる場合もある。
紙対電子の単純な優劣ではなく、長い物語を読み返すための手がかりをどこに持たせるか、という設計の話につながる。

実験に使ったマンガと読書条件の統制

使われたのはコアミックス刊・日暮キノコ「喰う寝るふたり住むふたり」第1巻の第1話〜第4話。
同棲カップルの同じ出来事を二人の視点で前半・後半に分けて描くザッピング構成で、各話の前半が18〜21ページ、後半が17〜22ページ。

紙の本は見開きで24.4 × 18.2 cm、反射光で照度を11.7 EV（ISO 400換算で約2,100 lx）にそろえている。
タブレットはMicrosoft Surface Pro X 13インチ（2019年モデル）で、画面サイズは25.5 × 18.2 cm。
バックライトで同じ11.7 EVに調整し、タッチ操作でページが瞬時に切り替わる設定にした。

半数の参加者は第1話・第4話を紙、第2話・第3話をタブレットで読み、残り半数は逆の組み合わせでカウンターバランスを取っている。
前半の読書時間は紙が1ページあたり平均8.1 ± 2.4秒、タブレットが7.5 ± 2.1秒で有意差なし（t[24] = 1.9, p = 0.07）。
紙のページめくり時間は別途3人で計測して平均0.7秒だった。

MRI装置内ではゴーグル型ディスプレイ（VisuaStim Digital、解像度800 × 600）で後半を表示し、1見開きあたり20秒の固定ペースで読ませている。
各見開きのあとに共感度を4段階で評定させた。

問題は各話6問ずつの全24問。
前半だけで答えられるSet 1が13問、前後半の統合が要るSet 2が11問という内訳だ。
各4択で、最良の選択肢が2点、次善が1点、それ以外は0点という採点方式だった。

反応時間差の内訳

正答率の2要因分散分析では、媒体の主効果がF[1, 24] = 0.01（p = 0.9）、問題セットの主効果がF[1, 24] = 0.7（p = 0.4）で、どちらも有意ではなかった。

反応時間では問題セットの主効果がF[1, 24] = 28, p < 0.0001。
Set 2はSet 1より一貫して遅い。
ただし媒体（紙/タブレット）×問題セットの交互作用は有意ではない（F[1, 24] = 1.6, p = 0.2）。
つまり分散分析で強く言えるのは「Set 2で全体に遅くなる」という主効果までで、「紙とタブレットで差がある」は事後検定レベルの傾向として読む必要がある。
その上で紙とタブレットを分けてSet 2 − Set 1の差（delta-RT）を計算すると、紙ではt(24) = 0.2, p = 0.8で差が出ない。
タブレットではt(24) = 2.9, p = 0.008で有意に伸びた。

TukeyのHSD検定で有意だったのは、タブレットのSet 2がタブレットのSet 1より長いペア（q[24] = 4.9, p = 0.01）と、タブレットのSet 2が紙のSet 1より長いペア（q[24] = 5.1, p = 0.007）の2つだ。
紙で前半を読んだ条件では、前後半を統合する問題でも反応が遅くならなかった。
ただし交互作用が非有意な以上、これは「タブレット条件内の前後差」がはっきり出たという話で、媒体間の差が統計的に確定したわけではない。

3つの統語ネットワークと活動パターンの差

論文は酒井教授らの先行研究で定義された3つの統語ネットワークを分析の枠組みに使っている。

ネットワーク	ブロードマン野	領域	役割
I	BA 44/45	左下前頭回（弁蓋部・三角部）	構文の中核処理
II	BA 6/8	左外側運動前野（LPMC）	時系列の処理、小脳との連携
III	BA 45/47	左下前頭回（三角部・眼窩部）	意味と構文の統合

fMRIのコントラスト[問題解答 − マンガ読書]で、紙条件では左LPMC/IFG（ネットワークI〜IIに相当する領域）に有意な活動が出た。
タブレット条件ではこのコントラストに有意な領域がない。

紙で前半を読んだ条件では、後半のマンガ読書中に左前頭の言語野の活動が低く、問題解答時にだけ活動が上がった。
その落差がコントラストとして検出されている。
報じられている「省エネ化」の神経科学的な中身はこれで、紙条件では後半の読書中に言語野の活動が低く、解答時との落差が大きく出た。

[Set 2 − Set 1]のコントラストでは、紙条件で右LPMC/IFGが出た。
Set 1（前半だけで答えられる問題）での右前頭の補助的な活動が紙条件で低い。
タブレット条件では右LPMC/IFGの代わりに右角回（R. AG）だけが活動した。
角回は空間レイアウトの再構成に関わるとされる領域で、タブレット条件では物語の空間記憶を組み直す処理が追加で入った可能性がある（論文は統語ネットワークI内での統語負荷の高さという別解釈も併記している）。
ただしこの右角回の活動は探索的な閾値（未補正 p < 0.01）で検出されたもので、論文自身もさらなる検証が要ると記している。

ROI分析では、左LPMC/IFGの問題セットの主効果がF[1, 24] = 4.6, p = 0.046。
Set 2のほうがSet 1より活動が大きい。
先行研究の言語獲得課題から定義した独立なROIで再現検証しても、F[1, 24] = 6.4, p = 0.02で同じ方向が出ている。

タブレット条件で出た右海馬と右紡錘状回

逆のコントラスト[マンガ読書 − 問題解答]では、タブレット条件だけで右海馬と右紡錘状回が有意に活動した。
紙条件には出ない。

右海馬はエピソード記憶の符号化、右紡錘状回は視覚的な形態処理に関わる領域。
タブレット条件では、マンガ読書中に紙では不要だった記銘のための脳活動が追加で入っていた。

タブレット条件のSet 2問題では、右LPMC/IFGの活動と正答率に正の相関が出ている（r = 0.40, p = 0.046）。
右前頭をより働かせた参加者ほど、前後半の統合問題で成績がよい傾向だった。
紙条件にはこの相関がない。
ただしp = 0.046は境界的で、「追加処理をした参加者だけが精度を保った」とまでは言い切れない。
そもそもこれは参加者間の相関であって、活動を増やせば成績が上がるという因果を示すものではない。

共感度の変化は紙もタブレットも同じ

MRI装置内で各見開きのあとに取った共感度評定も分析されている。
物語の進行に沿って共感度は有意に上昇した（F[1, 24] = 13, p < 0.0001）。
紙とタブレットの間に有意差はなく（F[1, 24] = 3.7, p = 0.07）、紙のほうがやや低い傾向が出たが統計的には有意でない。

反応時間や脳活動には差があったが、主観的な共感度には出なかった。
主人公への共感が後半に向けて高まる傾向は、前半の媒体に依存していない。

25人・単一作品のfMRI実験の条件

サンプルはN = 25（募集29人から左利き1人と、臨床的問題・矯正ワイヤー装着・複数ランでの過度な頭部運動の3人を除外）。
さらに前処理段階で、体動が基準を超えた5人・計6ランがfMRI解析から外されている。
論文中のパワー分析では、先行研究の16試行多択課題に基づいてFDR補正 p < 0.05で平均99%のパワーが得られたと報告している。

このパワーはfMRI指標についての報告で数字としては高いが、使われたマンガは「喰う寝るふたり住むふたり」1作品（4話分）だけ。
ジャンルや作風が異なる作品、たとえばバトル漫画やミステリのように情報密度の分布が違うものでも同じパターンが出るかは別の実験が要る。

タブレットはMicrosoft Surface Pro X（13インチ、横置き）で、画面サイズも光量も紙に揃えた条件だった。
スマートフォンの小画面や縦スクロール形式のWebtoonとは読書体験が異なる。

論文はマクルーハンの「光を受ける紙（light-on）と光を発する画面（light-through）」の概念にも触れている。
ただし今回の実験はタッチ切り替えの瞬時性が空間的手がかりを断つ効果を見た設計で、バックライトと反射光の生理的な影響を分離するものにはなっていない。

行動データとfMRIデータはOSFリポジトリ（osf.io/gxkvs）で公開されている。
論文の著者は東京大学大学院総合文化研究科の3名で、資金は梅島奎立への科研費（若手研究 24K16045）とコアミックスによる。
作品の版元でもあるコアミックスは資金提供元だが、研究デザイン・データ分析・論文執筆への関与はないと宣言されている。

同じ東大でも「描く側」の研究は別にある

この実験は漫画を「読む」側の認知を見たものだが、東大では漫画を「描く（生成する）」側の研究も出ている。

中山英樹（東大）を含む研究グループが2026年5月に公開したMangaFlowは、物語のテキストから複数ページの漫画を生成するエージェント型のフレームワークだ（arXivプレプリント）。
入力はシナリオにあたる物語テキストで、出力はコマ割り・セリフ・写植まで入った漫画ページになる。

なぜ「テキストから一枚絵を直接生成」では漫画にならないか

画像生成モデルにページ全体を一発で描かせると、コマ割りが指定通りにならない。
論文は、直接生成だとレイアウトが画像合成の副産物（implicit outcome）になり、コマ数が合わない・コマの境界が溶ける・作者が決めた構図が無視される、と指摘している。
漫画のコマ割りは見た目の装飾ではなく、視線の流れや間を作る物語の装置で、作者はコマを描く前にページ構成を設計する。
ところが一発生成のモデルは、レイアウト・キャラ・セリフを1枚の出力に混ぜてしまい、個別に制御できない。

MangaFlowはこれを、工程を分けたパイプラインで解く。

6段階のパイプライン

flowchart TD
    A[物語テキスト<br/>ページ・コマ数の指定] --> B[1 物語の計画<br/>シーンに分解]
    B --> C[2 メモリ構築<br/>キャラ・場面・小物の参照を紐付け]
    C --> D[3 レイアウト構築<br/>コマ枠を構造変数として生成]
    D --> E[4 参照条件付きでコマ描画<br/>各コマの絵を生成]
    E --> F[5 ページ合成<br/>コマをレイアウト通りに配置]
    F --> G[6 セリフ・写植の配置<br/>吹き出し・ナレーション]
    G --> H[完成した複数ページ漫画]

各段階の役割は次の通り。

段階	やること
1. 物語の計画	入力した物語を、つながりのあるシーン（story section）に分解する
2. メモリ構築	各シーンに登場キャラ・場面・小物の視覚的な参照を結びつけ、コマをまたいで使い回せるようにする
3. レイアウト構築	コマ枠を幾何的な構造変数として生成・再利用する。手動指定、テンプレート流用、自動生成から選べる
4. コマ描画	メモリのキャラ・場面参照とコマ単位のプロンプトを条件に、各コマの絵を生成する
5. ページ合成	描いたコマを目標のレイアウト通りにページへ並べる（決定論的に配置）
6. 写植	吹き出し・ナレーション枠・思考の吹き出しを、話者の位置と読みやすさを見ながら配置する

肝は、レイアウトを画像生成の副産物にせず、あとから編集・指定できる明示的な構造として独立に持つことだ。
コマ枠やコマ数は決定論的に扱うので、ユーザーはコマ数・ページ数・コマ配置・キャラや場面の参照画像・作風・言語を指定できる。物語は詳細なJSONでも自然言語のプロンプトでも渡せる。

実際に絵を描いているのはFLUXとGemini

MangaFlow自体は「描く」モデルではなく、工程ごとにモデルを呼ぶオーケストレーション層だ。
実際にコマの絵を出すのは、差し替え可能な画像生成モデル（backbone）の方になる。
論文ではFLUX.2 9B（Black Forest Labs）とGemini 2.5 Flash Image（Google、いわゆるNano Banana）の2つを使い、それぞれMangaFlow-FLUX・MangaFlow-Geminiとして比較している。前述の表の「Gemini / FLUX」はこの差し替えのことだ。
MangaFlowが受け持つのは物語の分解・コマ割り・参照の紐付け・写植といった段取りで、絵そのものはこのbackboneに描かせる。だから「絵の品質はbackbone次第」になる。

注意したいのは、パイプラインを動かすLLM（計画やコマ単位のプロンプトを作るエージェント）が、論文では「LLMベース」とだけ書かれ、どのモデルかは明記されていない点だ。
評価のところで出てくるGPT-4.1は、生成した漫画を読んで読みやすさや理解度を採点するジャッジ役で、作画には関わらない。

直接生成との差

論文のベンチマークでは、指定への追従が直接生成と大きく開く（直接生成はGemini版・FLUX版の2種）。

指標	MangaFlow（Gemini / FLUX）	直接生成（Gemini / FLUX）
コマ数の一致	100%（決定論的）	27.9% / 44.2%
レイアウト一致（IoU）	100%（決定論的）	42.8% / 41.1%
キャラ同一性（CIDS）	0.643 / 0.619	0.562 / 0.591
吹き出し配置スコア	97.4%	評価不能（読めるテキストを出せず）
読みやすさ（5段階）	4.87 / 4.71	3.80 / 2.67

コマ数やコマ枠は工程を分けて決定論的に置くので100%、キャラの一貫性や写植の読みやすさも直接生成を上回る。

限界も書かれている。最終的な絵の品質は土台の画像生成モデル（backbone）次第で、複雑なコマでは話者を見分けた吹き出し配置が難しい（漫画調の顔は位置の特定が難しい）。
評価に使ったMangaGen-MetaBenchも、人手でレイアウト・吹き出し・話者を注釈した本物の漫画データセットではなく、既存のストーリー可視化データを組み替えたメタベンチマークだと断っている。

読む側の酒井研と描く側の中山研は別チーム・別テーマで、今回のfMRI研究と直接つながる話ではない。漫画を脳の側とAIの側の両方から扱う研究が、同じ大学から並行して出ている。