【技術研究】PRIVATE AIで個人情報をマスクしてみた

【技術研究】PRIVATE AIで個人情報をマスクしてみた

エンジニアブログ
最終更新日:2025年08月23日公開日:2025年08月23日
久保 翔太
writer:久保 翔太
XThreads

ここ数年、生成AIの進化と普及は目覚ましく驚かされる日々ですね。

Ragateでも日常業務のさまざまなシーンでAIを活用する取り組みを進めています。
ただ一方で、顧客との会話の中で必ず出てくるのが「データの扱いは大丈夫なのか?」という質問です。

「入力した情報はどこに保存されるのか?」
「個人情報をAIに渡しても本当に安全なのか?」

こうした懸念は、生成AIをビジネスで活用するうえで避けては通れません。

そんな課題を解決する手段を探していたときに出会ったのが PRIVATE AI です。
PRIVATE AIはカナダ発のスタートアップが提供するサービスで、個人情報や機密データを自動的に検出し、匿名化やマスキングを行ってからAIに渡せる仕組みを提供しています。

例えば、文章やPDF、音声、画像などのデータを入力すると、名前・住所・電話番号・メールアドレスといった個人情報をAIが認識し、置き換えたり削除したりしてくれるのです。そのため、生成AIにデータを渡す前に「安全な形」に変換することが出来るみたいです。

これは、顧客から繰り返し聞かれる「データは守られるのか?」という問いに対して、非常に分かりやすい答えになりそうだと実際に動かしてみました。

https://www.private-ai.com/ja

まずは構成について

生成AIモデルの手前でPRIVATEAIを配置して、情報をマスクした後でモデルに渡していく様子。

APIドキュメントもあり、導入は簡単そう。
https://docs.private-ai.com/reference/latest/operation/process_text_process_text_post/

今回は管理画面から試せるということで、そちらからやってみることにしました。

試してみた

管理画面はこんな感じです。

ここでの機能は以下3つ存在していました。
今回はText RedactとFile Redactについて試してみました。

  • Text Redact:テキスト文の置き換え
  • File Redact:画像や音声の加工
  • Entity Recognition:テキストの確認

Text Redactを試す

文章はChatGPT5で、自己紹介を作成し貼り付ける。

皆さま、はじめまして。本日からこちらでお世話になります、久保と申します。どうぞよろしくお願いいたします。

まずは簡単に、これまでの経歴についてご紹介させていただきます。
私は新卒でIT業界のSIerに入社し、主にWebシステムの開発や運用に携わってきました。入社当初はプログラミングや設計で失敗の連続でしたが、プロジェクトの先輩方から学びながら改善を積み重ね、気づけば8年ほどシステム開発に関わってきました。特に印象に残っているのは、クラウド環境を活用した大規模ECサイトの構築プロジェクトです。新しい技術を積極的に取り入れながら、チームで課題を解決していった経験は、今でも自分の大きな財産になっています。

その中で私が大切にしてきたのは「技術を活かしながら、チーム全体で成果を出す」という姿勢です。どれほど優れたスキルを持っていても、一人でできることには限界があります。逆に、知識を共有し、互いに補い合えば、想像以上の成果を生み出せると実感しました。今回転職を決めたのも、まさにこの考え方を広げ、新しい環境で挑戦したいと思ったからです。

こちらの会社については以前から「最新技術を社会に広めている会社」という印象を強く持っていました。最新テクノロジーを一部の専門家にとどめず、誰もが使える“当たり前のもの”にしていく姿勢は、私がこれまで大切にしてきた「知識をシェアしてチーム全体を強くする」という考え方と重なります。その点で非常に共感を覚え、今回ご縁をいただけたことを本当に嬉しく思っています。

入社後にまず取り組みたいのは、皆さんの仕事の進め方を理解し、自分の経験をどう活かせるかを探っていくことです。前職では、生成AIやクラウドサービスを日常業務に取り入れ、効率化や新しいアイデアの創出に活用していました。例えば、提案書や報告書のドラフトをAIに作成させ、その分メンバーが企画や戦略に集中できるようにすることで、チーム全体の生産性を高めることができました。こうした経験は、きっとこの会社でも役立てられるのではないかと思っています。

また、私は人と話して学び合うことが好きなので、社内のナレッジ共有にも積極的に関わりたいと考えています。自分の知識や経験をオープンに提供するだけでなく、皆さんからも多くを吸収し、成長につなげたいと思っています。特にこの会社には多様なバックグラウンドを持つ方々が集まっていると伺っており、その中で学び合えることを今からとても楽しみにしています。

少しプライベートなお話もさせていただきます。趣味はランニングとカメラです。休日にはランニングで気分をリフレッシュしたり、風景や街並みを撮影することで新しい発想を得ることがあります。もし同じ趣味をお持ちの方がいらっしゃれば、ぜひ気軽に声をかけていただけると嬉しいです。

これから新しい環境で学ぶことは山ほどありますが、一日でも早く皆さんのお役に立てるよう、全力で取り組んでまいります。そして、チームの一員として成果を出すだけでなく、皆さんと一緒に「最新技術を大衆化する」というビジョンを実現していけたらと思っています。改めて、本日からどうぞよろしくお願いいたします。

結果

2~3秒程度で結果が返って来ました。

皆さま、はじめまして。本日からこちらでお世話になります、[NAME_FAMILY_1]と申します。どうぞよろしくお願いいたします。

まずは簡単に、これまでの経歴についてご紹介させていただきます。
私は[OCCUPATION_1][OCCUPATION_2]業界の[ORGANIZATION_1]に入社し、主にWebシステムの開発や運用に携わってきました。入社当初は[OCCUPATION_3]や設計で失敗の連続でしたが、プロジェクトの先輩方から学びながら改善を積み重ね、気づけば[DURATION_1]ほどシステム開発に関わってきました。特に印象に残っているのは、クラウド環境を活用した大規模ECサイトの構築プロジェクトです。新しい技術を積極的に取り入れながら、チームで課題を解決していった経験は、今でも自分の大きな財産になっています。

※後半は特に変換されなかったので割愛。

変換前

変換後

久保

[NAME_FAMILY_1]

新卒

[OCCUPATION_1]

IT

[OCCUPATION_2]

SIer

[ORGANIZATION_1]

プログラミング

[OCCUPATION_3]

8年

[DURATION_1]

おおー、、お?
新卒が職業というカテゴリーで変換がかかっていたり、Webシステムの開発で変換がかかっていなかったり多少の違和感があるが良き。

管理画面上で、「Confidence」という項目もあり、その変換にどのくらいの自信があったかを示している。
名前は精度高く変換されているがそれ以外が少々低い。(メインターゲットが、医療や銀行だったりするのでそこも関係していそう。)

File Redactを試す

文書ファイルでも加工がいけるとのことなので、先程のテキストをWordにしてアップロードしたら同様の結果が得られました。
画像も加工出来るとのことですが、今回は割愛。

試してみての所感

最後にPRIVATE AIを実際に試してみて、いくつか感じたことを書きます。

まず一番大きなメリットは、Amazon S3に格納した元データをPRIVATE AIで加工し、それを生成AIに渡す構成をとることで、個人情報がそのまま生成AIに流れるリスクを大きく減らせると感じたことです。これにより、「データを外に出してしまうかもしれない」という不安が和らぎ、安心して生成AIを活用できる下地ができると思いました。

一方で、課題も見えてきました。
PRIVATE AIは非常に高精度に個人情報を検出してくれるのですが、ここは加工してほしくなかった」というデータまで置き換えられてしまうケースや、逆に「ここは匿名化してほしいのに残ってしまう」というケースもありました。つまり、実運用で本格的に導入するには、検出精度やルール設定のチューニングが必要になりそうです。

ここで気になったのは、「そもそもPRIVATE AIは、どこまでチューニング可能なのか?」という点です。検出対象の種類やスコープをカスタマイズできれば現場のニーズに即した運用ができますが、現状はブラックボックス的に「お任せ」になっている部分もありそうです。今後の製品アップデートでどの程度柔軟性が高まるかに注目したいと思います。

Ragateは幅広い業種の顧客がいる為、すぐに会社としての導入は難しいというのが率直な印象です。ただし、技術の進化スピードを考えると、今後のバージョンアップや精度向上によって実用性は確実に高まっていくはずです。したがって、現時点では「すぐ使う」というよりも、動向を継続的にウォッチし、実証的に試しながら知見を貯めていく段階なのかなと考えています。

Careerバナーconsultingバナー