fixing-transcriptions

tomada1114's avatarfrom tomada1114

とまだの文字起こし・音声入力(Whisper等)の誤変換・誤字脱字を自動修正するスキル。AI駆動開発、Claude Code、MCP、プログラミング用語の誤変換を専門的に修正。「文字起こしを修正」「誤変換を直して」「誤字脱字を修正」「音声入力を整理」「テキストをクリーンアップ」「変換ミスを直して」と言われたときに使用。Obsidianノートの文字起こし整理、技術用語の表記統一に最適。Use PROACTIVELY when fixing transcriptions, correcting voice input errors, or cleaning up Whisper output.

1stars🔀0forks📁View on GitHub🕐Updated Jan 7, 2026

When & Why to Use This Skill

This Claude skill is a specialized transcription refiner designed to automatically correct misconversions, typos, and phonetic errors in voice-to-text outputs (such as Whisper). It employs a sophisticated two-phase process: a high-speed Python-based mechanical replacement for 300+ technical patterns followed by an LLM-driven contextual analysis to disambiguate complex terms. It is specifically optimized for AI-driven development, Claude Code, MCP, and general programming terminology, ensuring that technical notes and transcripts are accurate, professional, and consistently formatted.

Use Cases

  • Refining Whisper-generated meeting transcripts to ensure technical jargon like 'Claude Code', 'MCP', and 'Anthropic' are correctly identified and spelled.
  • Cleaning up voice-dictated technical notes for Obsidian or other knowledge bases by unifying terminology and fixing common dictation errors.
  • Automating the correction of phonetic misspellings in raw voice-to-text inputs before converting them into formal documentation or blog posts.
  • Disambiguating context-heavy terms such as 'Haiku' (AI model vs. poetry) or 'Cursor' (IDE vs. mouse pointer) in technical transcriptions.
  • Standardizing the notation of file names (e.g., CLAUDE.md) and developer tool commands within raw text logs.
namefixing-transcriptions
descriptionとまだの文字起こし・音声入力(Whisper等)の誤変換・誤字脱字を自動修正するスキル。AI駆動開発、Claude Code、MCP、プログラミング用語の誤変換を専門的に修正。「文字起こしを修正」「誤変換を直して」「誤字脱字を修正」「音声入力を整理」「テキストをクリーンアップ」「変換ミスを直して」と言われたときに使用。Obsidianノートの文字起こし整理、技術用語の表記統一に最適。Use PROACTIVELY when fixing transcriptions, correcting voice input errors, or cleaning up Whisper output.

Transcription Fixer(文字起こし修正スキル)

音声入力(Whisper等)で生成されたテキストの誤変換を2段階方式で自動修正するスキルです。

概要

Phase 1(機械的置換) + Phase 2(LLM判断) の2段階で処理します。

Phase 1: Python スクリプトで辞書ベースの確実な置換(高速・コストゼロ)
    ↓
Phase 2: LLM で文脈依存の微妙な判断(高品質)

処理フロー

Phase 1: 機械的置換

Pythonスクリプトで辞書ベースの置換を実行:

python3 ~/.claude/skills/fixing-transcriptions/scripts/fix_transcription.py <path>

オプション:

  • --dry-run: 変更を適用せずプレビュー
  • --json: JSON形式で出力(LLM連携用)

出力例:

Phase 1: 機械的置換 完了
処理ファイル数: 30件
修正あり: 22件
総修正件数: 150件

修正内容:
  - file1.txt: 5件 (クロードコード→Claude Code, cloud.md→CLAUDE.md)
  - file2.txt: 3件 (アンソロピック→Anthropic, フックス→Hooks)

Phase 2: LLM判断

Phase 1で処理できない文脈依存のパターンをLLMで判断:

  • 「クラウド」→ Claude or クラウド?
  • 「カーソル」→ Cursor or カーソル?
  • 「ノート」→ note or ノート?

辞書ファイル

~/.claude/skills/fixing-transcriptions/dictionaries/misconversion-dict.json

構造

{
  "exact_match": {
    "ai_services": { "クロードコード": "Claude Code", ... },
    "claude_code_files": { "cloud.md": "CLAUDE.md", ... },
    "claude_code_features": { "フックス": "Hooks", ... },
    ...
  },
  "regex_patterns": [
    { "pattern": "...", "replacement": "..." }
  ],
  "context_dependent": [
    { "pattern": "クラウド", "candidates": ["Claude", "クラウド"], "hint": "..." }
  ]
}

カテゴリ

カテゴリ 内容
ai_services Claude Code, Anthropic, ChatGPT等
claude_code_files CLAUDE.md, settings.json, .claude/rules/
claude_code_features Hooks, Skills, サブエージェント等
claude_code_commands /init, /clear, /compact等
claude_code_tools Read, Write, Edit, Bash等
mcp_related MCP, Playwright MCP, Context7等
programming_languages TypeScript, Python, Node.js等
dev_tools npm, Git, Prettier, VS Code等
common_errors 過読性→可読性, エラー形→エラー系等

使い方

コマンドから(推奨)

/fix-transcriptions /path/to/file.txt
/fix-transcriptions /path/to/directory/

直接スキルを使う

このテキストの誤変換を修正してください:
[テキストを貼り付け]

文脈依存パターン

以下のパターンはLLM(Phase 2)で判断:

パターン AI文脈 一般文脈
クラウド Claude クラウド(雲/サービス)
カーソル Cursor カーソル(矢印)
ノート note(プラットフォーム) ノート(メモ)
俳句 Haiku(モデル) 俳句(詩)
ソネット Sonnet(モデル) ソネット(詩)
禅/ゼン Zenn(ブログ) 禅(仏教)

辞書への追加

新しいパターンを追加する場合:

  1. JSON辞書を編集: ~/.claude/skills/fixing-transcriptions/dictionaries/misconversion-dict.json
  2. 適切なカテゴリに追加
  3. context_dependent は文脈判断が必要なもののみ

スキルの役割分担

fixing-transcriptions(このスキル)

  • 対象: 全ての文字起こしテキスト
  • 役割: Phase 1 + Phase 2 で誤変換修正

fixing-srt-subtitles

  • 対象: SRT字幕ファイル専用
  • 役割: SRTフォーマット固有の処理 + このスキルの辞書を使用

関連ファイル

~/.claude/skills/fixing-transcriptions/
├── SKILL.md                    # このファイル
├── dictionaries/
│   └── misconversion-dict.json # 誤変換辞書(300+パターン)
└── scripts/
    └── fix_transcription.py    # Phase 1 スクリプト

更新履歴

  • 2025-01-16: Phase 1(機械的置換)+ Phase 2(LLM判断)の2段階方式に改善
    • Pythonスクリプトによる高速な機械的置換を追加
    • JSON辞書形式に移行(misconversion-note.md → misconversion-dict.json)
    • 300+パターンをカテゴリ別に整理
fixing-transcriptions – AI Agent Skills | Claude Skills