✨ VLM強化ネイティブOCR

見て、
理解する。

マスクでテキストを翻訳し、VLMで世界を理解する。macOSのために最適化された、プライバシー重視のオンデバイス魔法。

ゲーム、漫画の生肉、プレゼン資料、手書きノートに最適です。

元の画像

ドカン!!

このプロトタイプ、来週までに仕上げる。

maskの翻訳結果

Boom!

This prototype must be finished by next week.

マスクした部分だけを、そのまま翻訳

必要な部分だけを選択。翻訳は元のレイアウトを崩すことなく、自然に統合されます。

📸 従来のスクリーンショット翻訳

  • 範囲を指定して撮影、アップロードを待ち、アプリを切り替える必要がある
  • 翻訳されたテキストが元の画像の文脈から切り離される
  • 手動操作の繰り返しで、読書やゲームの没入感が削がれる

✨ maskの環境適応型翻訳

  • ダイアログを選択するだけで、瞬時にその場で翻訳結果を表示
  • 翻訳がゲームや漫画のシーンに美しく溶け込む
  • 途切れることのない、連続したリーディング体験のために設計

コアテクノロジー

AppleのネイティブAPIと最新の視覚言語モデルの力。

🧠

VLMによる状況理解

単なる文字認識を超え、maskはVLM(視覚言語モデル)を活用して、漫画の背景、UI要素、グラフ、ラフスケッチの文脈を理解します。

🛡️

完全なオンデバイスのプライバシー

Apple Visionフレームワークを利用し、画像切り抜きと文字抽出はすべてローカルで処理されます。クラウドのVLMを明示的に選択しない限り、画像がMacから外部へ送信されることはありません。

⚡️

柔軟なAIモデル選択

OpenAI、Gemini、Qwen、DeepSeekをニーズに合わせてシームレスに切り替え可能。さらにOllamaに接続して、完全なオフライン翻訳を構築することもできます。

テキストを超え、シーン全体を理解する

従来のOCRは単に文字を読むだけですが、maskのVLMは「見ているもの」を真に理解します。

シナリオ 従来のOCR翻訳 mask(VLM強化翻訳)
図やスケッチを含む手書き会議ノート バラバラの単語として認識され、意味不明な翻訳になる 「アプリの設計図」であるという文脈を理解し、理にかなった翻訳を出力
漫画の特殊なフォントの「擬音語」 文字として認識できず、エラーになるか文字化けする 視覚的な形から「ドカン」と判断し、文脈に合わせて「Boom!」とスマートに翻訳
データが密集した学術グラフ 軸のラベルだけがバラバラに翻訳される グラフのトレンドや重要な変化を自動的に要約し、自然な文章で説明

あらゆるワークフローに最適

🎮 未翻訳ゲームのプレイ

Alt-Tabで画面を切り替えることなく、UIメニューやストーリーの会話をリアルタイムで翻訳し、没入感を保ちます。

📖 外国語の漫画・コミック

吹き出しの部分だけをマスク。美しいアートワークをそのまま残しながら、母国語でセリフを楽しむことができます。

📊 学術的なプレゼン資料

専門的なスライドを翻訳。複雑な図表やフローチャートの意味を失うことなく、効率的に内容を把握できます。

✍️ 手書きメモのデジタル化

海外のチームメンバーが書いたラフなコンセプト図やメモを、素早く自分の言語に翻訳してテキスト化します。

妥協なきプライバシー保護

あなたの画面はあなただけのものです。私たちはそれを守り抜きます。

💻

システムレベルのキャプチャ

ネイティブSCKit APIを使用

🔒

ローカルのApple Vision

100%デバイス内でOCR処理

インプレイス・オーバーレイ

画面の同じ位置に瞬時にレンダリング

世界を見て、理解する準備はできましたか?

あなたのMacで、違和感のない環境適応型翻訳の魔法を今すぐ体験してください。

macOS版 mask を無料でダウンロード

システム要件: macOS 14.0 以降