ストックマーク vs FastLabel ── GENIAC第4期が示した日本の暗黙知データ化2陣営マップ

5月14日、経産省が動いた ── GENIAC第4期で起きたこと
観点3点 ── この記事で扱う論点はこの3つだけ
「暗黙知のフィジカルAI化」を分解する (動画 + 骨格 + 視線)
なぜ国家プロジェクトになったか ── 技能伝承の構造危機
もう一つの陣営 ── ストックマーク16社が示す「テキスト系暗黙知」
中小製造業がGENIACを待たずに今日始める6ステップ
落とし穴 ── やる前に知っておくべき失敗例7つ
「データ化」と「採用」を分けないという結論
まとめ

5月14日、経産省が動いた ── GENIAC第4期で起きたこと

2026年5月14日、経済産業省とNEDOは GENIAC第4期 の採択結果を発表した。
製造業データAI-Ready化枠で 9件 (応募36件)、ロボット基盤モデル枠で 2件。前者は1件あたり最大 5億円・100%委託 という重い座組だ。

注目すべきは、この9件のうち 「身体動作の暗黙知」をやる唯一の採択企業 が FastLabel だった点である。
連携先は国内大手自動車OEM。テーマ正式名称は「生産技能者が保有する暗黙知の構造データ化に係る技術開発及び産業汎用性の検証に関する研究開発」。

同日採択された ストックマーク主導案件は国内16社のコンソーシアム で、味の素・伊藤忠・スズキ・三井住友・三菱ケミカル・住友化学・ジェイテクトなどが並ぶ。
ただしストックマーク案件は テキスト・図面・社内ドキュメントの暗黙知 を扱う。
つまりGENIAC第4期は、テキスト軸と身体動作軸という 2つのデータ層を国が同時に押さえた構図 になっている。

この2陣営マップを最初に整理することが、本記事のスタート地点だ。

観点3点 ── この記事で扱う論点はこの3つだけ

「暗黙知のフィジカルAI化」を分解する (動画 + 骨格 + 視線)

FastLabelが今回扱うデータは大きく3層に分かれる。

層	データ種別	取得手段
1	工程作業動画	一人称 (GoPro / iPhone胸ポケット) と三人称 (三脚) を同時収録
2	骨格モーションデータ	関節角度・手先軌跡 (MediaPipe / OpenPose系)
3	視線データ	アイトラッキングデバイスでの eye-gaze 取得

この3層を マルチモーダル・アノテーション で同一タイムラインに揃え、VLM (Vision Language Model) と差分解析で「うまくいった工程」と「いかなかった工程」の違いを自動抽出する。
最終アウトプットは VLAモデル (Vision-Language-Action) の学習用フォーマットだ。

VLAモデルは Physical Intelligence の Pi-0、Figure AI の Helix-02、Figure 02 などに代表される、実世界マルチモーダルデータを大量に必要とする系統である。
既存の OXE データセット (22ロボット527スキル) は 日本工場の「擦り合わせ・面取り・微調整」を含まない。
ここに日本独自のデータ層を作りにいく、というのが今回の戦略軸である。

FastLabelが扱う3層データ (動画/骨格/視線) のVLA学習パイプライン

なぜ国家プロジェクトになったか ── 技能伝承の構造危機

「暗黙知のデータ化」がなぜ国家予算 (1件5億円上限) を割く対象になったのか。
背景は ものづくり白書2025 (2025年5月閣議決定) に集約されている。

指標	値	出典
製造業就業者推移	1055万人 → 1046万人 (-9万人)	ものづくり白書2025
「技能伝承を経営課題」と回答した企業	約6割	ものづくり白書2025
中小製造業DX未着手率	12% (2024年度・前年30%から改善)	ものづくり白書2025

未着手率は改善傾向にある。一方で 熟練工がいなくなる速度 はそれを上回るペースで進行している。
構造的な問題なので、個社の努力だけでは詰まる。だから国がデータ層に予算を入れた、というのが今回の文脈である。

上位政策としては、政府の フィジカルAI 5年1兆円 方針 (2026年度予算3,000億円) と、令和8年3月閣議了承のAIロボティクス戦略 がある。
NVIDIA Cosmos / Isaac GR00T などの海外基盤モデルに対し、データ層を日本企業が握る ためのGENIAC枠と理解しておけばいい。

引用ガード: 2022年度値の「能力開発に問題ありとした事業所82.8%」という数字が各種記事で流通しているが、R006 (引用は直近3か月以内) に抵触するため本記事では採用しない。直近データは上記ものづくり白書2025に統一している。

もう一つの陣営 ── ストックマーク16社が示す「テキスト系暗黙知」

GENIAC第4期を読み解く鍵は、FastLabel単体 ではなく ストックマーク陣営との対比 にある。
両者の役割分担を表にすると以下のようになる。

観点	ストックマーク陣営 (16社)	FastLabel陣営 (自動車OEM)
扱うデータ	図面・社内文書・規程・会議録	工程動画・骨格・視線
ターゲット暗黙知	「設計判断」「業務判断」のテキスト系	「身体動作」「微細調整」のフィジカル系
出口	業務LLM・ナレッジ検索	VLA (Vision-Language-Action) モデル
想定する後工程	社内コパイロット・図面検索	協働ロボット・人型ロボット制御
参画形態	16社コンソーシアム	OEM1社との深い連携

両陣営は対立しているのではなく、日本のフィジカルAIを成立させるための車の両輪 である。
テキスト系の判断ロジックを持つLLMと、身体動作を持つVLAは、最終的には同じ現場で結合される。
GENIAC第4期はその両方に同時に予算を張った、と読むのが妥当だ。

中小製造業がGENIACを待たずに今日始める6ステップ

5億円のプロジェクトが動いているからといって、中小現場が傍観する必要はない。
むしろ GENIAC採択企業がやっていることをミニマムに再現する だけで、技能伝承の出発点には十分立てる。

総コストは 想定値: 5万円以下 に収まる。内訳は後述する。

Step 1. スマホ三脚で熟練工作業を撮る (Day 1〜2)

一人称はiPhoneを胸ポケットや作業帽に固定。三人称は2,000円前後の三脚を作業台斜め前に設置する。
1工程5〜10分 × 10本程度を目安にする。

Step 2. 「○ / ×」だけタグ付け (Day 3)

凝ったアノテーションは要らない。ExcelかNotionで動画ファイル名・結果・一言コメント を残すだけでいい。

20260518_面取り_001.mp4 , ○ , 角の引っかかりなし
20260518_面取り_002.mp4 , × , 角に0.2mmバリ残り
20260518_面取り_003.mp4 , ○ , 上記より速度遅め

この粒度で十分、後段のAIが差を見つけてくれる。

Step 3. AIに動画を見せて「違い」を抽出 (Day 4〜7)

Claude (Sonnet系) / Gemini 2.5系 / GPT-4o の動画対応モデルにアップロードする。
プロンプトは1行で済む。

○の動画と×の動画を比較し、手の位置・速度・順序の違いを箇条書きで挙げてください。

「3秒目で手首が外側に5度傾いている」「工具を握り直すタイミングが異なる」など、
熟練工本人が言語化できなかった差 が言語側から自動的に立ち上がってくる。
ここが最大のレバレッジポイントだ。

Step 4. 骨格抽出はMediaPipeで無料 (Day 8〜14)

Google製の MediaPipe Pose を使えば、Python数十行で関節角度がCSVに落ちる。

import cv2, mediapipe as mp, csv

pose = mp.solutions.pose.Pose()
cap = cv2.VideoCapture("20260518_面取り_001.mp4")

with open("joints_001.csv", "w", newline="") as f:
    w = csv.writer(f)
    w.writerow(["frame", "right_wrist_x", "right_wrist_y", "right_elbow_angle"])
    frame = 0
    while cap.isOpened():
        ok, img = cap.read()
        if not ok: break
        res = pose.process(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
        if res.pose_landmarks:
            lm = res.pose_landmarks.landmark
            w.writerow([frame, lm[16].x, lm[16].y, "..."])
        frame += 1

CSVをExcelで読み込み、ベテランと新人の手首軌跡を 同じグラフに重ねる だけで、
「ベテランは振り幅が小さい」「新人は終端で減速していない」といった差が目視で分かる。

Step 5. VLA本格学習はまだ早い

ここが冷静さの境目だ。Pi-0 / Helix-02 / Figure 02 系のVLAモデルをローカル再現するのは、中小規模では非現実的 (数千万円〜億コース)。
当面は「動作の数値化 + 教育ビデオ自動生成」までで止めておき、ROIはそこで回収する。

Step 6. 採用とのセット設計

抜いた暗黙知を 誰に渡すか が決まっていないと、データは死蔵される。
新人の入社時研修・中途のオンボーディング・派遣社員の立ち上がりに同時設計する。
これは観点③で詳しく扱う。

コスト内訳 (想定値)

項目	コスト
スマホ三脚	2,000円
MediaPipe	0円 (OSS)
Claude / Gemini / GPT-4o API 動画解析 (10本想定)	想定値: 3,000〜10,000円
動画ストレージ (Google Drive 100GB)	250円/月
撮影・タグ付け人件費 (1人20時間)	想定値: 3〜4万円
合計	想定値: 5万円以下

外部にPoCを発注すれば数百万円コースのテーマが、自社内で5万円スタートできる。
ここが本記事で最も伝えたい「真似する側」の立ち位置である。

社内にClaude Codeを持ち込んで動画解析パイプラインを内製したい中小製造業のIT担当向けには、伴走型サービスも存在する。

🥷 Claude Code を本気で社内導入するなら

「自社の業務を Claude Code で自動化したいが何から手をつけるか分からない」中小製造業向けの伴走型トレーニング AI鬼管理。無料の業務効率化診断 (オンライン面談) で、自社のどこから自動化できるかが見える化される。

▶ AI鬼管理 | Claude Code活用の業務自動化トレーニング無料診断を予約する

※公式LINE経由でも申込可・診断のみで無理な勧誘なし

落とし穴 ── やる前に知っておくべき失敗例7つ

「暗黙知データ化」という言葉は耳ざわりがいい。だからこそ 失敗例を先に並べる 必要がある。
ここでは7つ挙げる。最低どれか1つは自社にも該当するはずだ。

1. マニュアル肥大化症候群

熟練工の技術を細部まで言語化しようとした結果、500ページのマニュアルが完成して誰も読まない。
形式知化の罠としては最も古典的だが、いまだに大半の現場で起きている。

2. 「使われないデータベース」問題

高額なナレッジマネジメントシステムを導入したが、入力する側に動機がなく、参照する側にも検索性がない。
箱だけ立派でデータが入らない のは、技能伝承DXの王道の失敗形である。

3. 動画NDA壁

工場作業映像は 取引先NDAで社外持ち出し禁止 になっているケースが多数派。
クラウドAIに投げる前に、社内ガイドラインの整備と、できれば オンプレ動作するモデル (Llama / Gemma 系) の検討が必要になる。

4. MediaPipe骨格抽出の照明・服装依存

黒い作業服・反射する保護メガネ・暗所の機械加工エリアでは、MediaPipe Pose の検出精度が大幅に落ちる。
撮影時は照明を足す、コントラストのある作業服に変える、複数アングルで撮って欠損を相互補完する、という運用工夫が前提になる。

5. VLA再現非現実トラップ

「Pi-0 を社内で動かしたい」という要望は GPU・データ・MLOps人材すべてが揃って初めて成立する。
中小製造業がいきなりここを目指すと、PoCが空中分解する。Step 5で線を引く理由はここにある。

6. 「GENIAC採択企業に発注すれば暗黙知が抜ける」誤解

FastLabelもストックマークも 基盤技術開発が本業 であり、個別中小企業への請負は前提にしていない。
「採択企業に発注=暗黙知抽出」ではないことは押さえておきたい。

7. 教える時間が削られる連鎖

技能伝承プロジェクトを始めると、熟練者の本業時間が削られて生産効率が落ちる というジレンマが必ず発生する。
撮影は休日や閑散期に寄せる、1日30分まで、といった 時間設計を最初に決めておく のが現実解だ。

「データ化」と「採用」を分けないという結論

ここまでで技術論は揃った。最後に、観点③に戻る。

暗黙知データ化の出口は 「ベテランがいなくても回る現場」 だが、これは新人や中途が 回す側 に立たない限り意味を持たない。
つまり「技能伝承」と「採用・育成」は 同じ施策の表と裏 である。

フェーズ	技能伝承側	採用・育成側
1. 抜く	熟練工の動作を撮影・構造化	—
2. 整える	AIで「違い」を抽出	新人向けにビジュアル教材化
3. 渡す	データを社内に資産化	オンボーディング設計に組み込む
4. 回す	データを更新・追加	新人が次の熟練工になる導線設計

ここで詰まる中小製造業が多い。
「データは抜いたが渡す相手がいない」、あるいは 「人は採ったが渡すデータがない」。
両輪で設計しないと回らないので、技能伝承と採用支援は 同じテーブルで議論する べきテーマである。

採用と暗黙知データ化をセットで設計したいなら、製造業特化の採用支援サービスが入り口になる。

🌿 人手不足の解決は「採用代行」も選択肢

100種類の採用ツールを組み合わせる採善策（株式会社ｂサーチ）は無料プランニング実施中・しつこい営業なし。「うちの規模・業種で頼める？」だけでも相談OK。

▶ 100種類の採用ツールを組み合わせた採用代行＆無料プランニング実施中【採善策】

※無料プランニングのみでもOK・期間限定／部分委託も相談可

まとめ

論点	結論
GENIAC第4期で何が起きた	製造業AI-Ready化9件 + ロボット基盤2件採択、1件最大5億円。データ層への国家投資
2陣営マップ	ストックマーク (テキスト系・16社) vs FastLabel (身体動作系・自動車OEM)
中小はどう動くか	スマホ + MediaPipe + LLM動画解析で想定値5万円以下から開始可能
落とし穴	マニュアル肥大化・データベース死蔵・NDA壁・服装依存・VLA再現非現実・誤解発注・時間削減連鎖の7つ
結論	「データ化」と「採用」は同じ施策。分けて設計しない