未開始Chapter 620 分
データセット構造と meta/info.json
Dataset Structure & Metadata
LeRobot データセットのフォーマット、ディレクトリ構造、メタデータファイルを理解します。
未開始
完了すると学習パスとホームの統計に反映されます
0%
学習目標
- LeRobot データセットのディレクトリ構造を理解する
- meta/info.json の役割を押さえる
- データセットの不整合を診断・修正できるようになる
原理解説
- 1データセットは parquet ファイルと動画から構成されます
- 2meta/info.json にデータセットのメタ情報が格納されます
- 3正しいフォーマットが学習成功の前提条件です
手順
1
ディレクトリ構造
data/、meta/、videos/ などの役割を把握します。
2
メタデータ確認
info.json の中身が想定通りか確認します。
3
データ検証
ツールを使ってデータセットの完整性を検証します。
コマンド
データセット構造を確認
bash
tree ~/.cache/huggingface/lerobot/your-name/so100-taskメタデータを表示
bash
cat ~/.cache/huggingface/lerobot/your-name/so100-task/meta/info.jsonデータセットを検証
bash
python -c "from lerobot.common.datasets.lerobot_dataset import LeRobotDataset; ds = LeRobotDataset('your-name/so100-task')"チェックポイント
- ディレクトリ構造を理解している
- info.json の内容が正しい
- データセットを読み込んでもエラーが出ない
よくあるエラー
FileNotFoundError: meta/info.json
- 原因:
- データセットのメタデータファイルが存在しません。
- 対処:
- データセットディレクトリの完整性を確認します。欠損している場合は再収集が必要です。
bash
ls -la ~/.cache/huggingface/lerobot/your-name/so100-task/meta/