ぱんだの徒然日記

無二ぱんだが料理やスイーツ、ネットの裏側や隠された謎を追っているブログ

☆このブログについて(広告・運営方針のご案内)はこの文をクリック

もう解読に迷わない。あなただけの「文字化け辞書」が作れる復元ツールを公開!

  ブックマーク   シェア   ツイート   ポケット   LINE

【広告】記事内に広告を利用しています。

 

ARG(Alternate Reality Game:代替現実ゲーム)の解読をしていて、この文字化けはなんて書いてあるんだ……?

「文字化け 復元」と検索をかけて出てくる、以前私も利用させていただいていたツールでも成功率は3割でした。

なんとなくこんな感じのことを言ってるのかな~?

利用する側が解釈をする感じで、進んでいたのです。

 

前回公開した、16進数を日本語に変換するツールと同様に、精度が芳しくなくて復元した文字から無二ぱんだ含めプレイヤーは、「これってこういう意味か?」と。

復元ツールに文字化けを入れて、2割復元された宇宙語からなんとかく読める日本語を脳内で繋ぎ合わせ、「これはこういう文章だろう!」と勝手に解釈していたり、もう解読そのものを諦めたりしていませんか?

 

「読めないなー、でもいいや。内容さえ判ればなんとなく理解できるし。」

半ばあきらめたりしていました。

せめて復元精度がもう少し高ければいいのに……。

そこで閃いた無二ぱんだ。無いならAI(Gemini)に要望を出して作ってしまおう!

 

そんな思いで今回、第四境界さんが使ったりしている文字化けを解読する、ファンによるファンのための「文字化け復元ツール」が完成しました。

代替現実ゲームのお供に、原因不明で文字化けしちゃったときの解読に、ぜひご活用ください。

*本ツールは、ファンによる非公式の攻略支援ツールです。

*このツールのプログラムの構築は、AI(Gemini)の力を借りましたが、スマホの使いやすさや「辞書を育てる機能」など、私のこだわりを形にして共同開発したものです。

 

このツールの仕組みを解説

パソコンやスマーフォンがどうやって文字を表示させているのかにもちょっと絡んできます。それを踏まえて読んでみてね。

1、データの切り分け方がズレている。
  • 今の標準はUTF-8:漢字1文字を「3つのパーツ(3バイト)」で記憶します。
  • 昔の標準はShift-JIS:漢字1文字を「2つのパーツ(2バイト)」で記憶します。
2、なぜ宇宙語や文字化けが起こるか?

本来なら「3つセット」で1文字として読むべきデータをこのツール(文字化け復元)では無理やり「2つセット」で読もうとしています。

 

例えば、123456というデータがあったとします。

正解(UTF-8)は、「123」で1文字、「456」で1文字と読みますが、

間違い(SHIft-JIS)は、「12」で1文字、「34」で1文字、「56」で1文字と読みます。

 

文字化けは、UTF-8のルールに基づいて3つセットで1文字と読むはずのものを、SHIft-JISのルールである2つセットで1文字と読もうとすることで起こる現象(文字化け)なのです。

 

3、ツールがやっていること

このツールでは、その「ズレた結果、起きてしまった現象(文字化け)」を塊ごと捕まえて、正解のルールに則って日本語に置き換えています。

なので、ツールには意味のある「塊(フレーズ)」として登録する機能がついています。

 

4、なぜ「塊」で登録する必要があるのか?

実はこのお話は、高校の「情報Ⅰ」の授業で習った(あるいは教科書の隅っこに載っていたかも?)、または中学の「技術・家庭科」の中の「情報の技術」といった授業で、「デジタル作品の制作」や「情報の計測・制御」を学ぶ際、文字や画像がどうデータ化されているか基礎を教わっているはずなのです。

 

中学生の授業は2001年度の学習指導要領改訂以降、必須科目になっています。

高校生の授業は2022年度から全国で「情報Ⅰ」の授業は必須科目になっています。

なお、2026年度の大学入学共通テストにも「情報」が導入されているため、文字コードの仕組みは受験科目の一部でもあったりする身近なトピックなのです。

 

授業で習ったことを思い出してくださいませ。

ここの説明は「文字コード」の話が深く関係しています。

分野でいうと「コンピューターとネットワーク」または「情報のデジタル化」。

 

先ほどの2つ目のおさらいになりますが、

現代のネットの標準である「UTF-8」は、日本語1文字を3バイトで読んでいます。

対して一昔前の「SHIft-JIS」は、日本語1文字を2バイトで読んでいます。

 

そのズレを正しい読み方にするのがこのツールなのですが、当然完璧といえず、まだまだすべての文字化けを日本語に復元できるわけではありません。

このツールは、代替現実ゲームをするプレイヤーたちが発見した文字化けの正解の読み方を「塊」として登録していくと、次回からは登録した通りに解読するようになる「解読辞書」なのです。

 

もっとパソコンやネットやITの基本原理に関しては、総務省の国民のためのサイバーセキュリティサイトに判りやすく解説されています。興味がある方は、こちらの情報もぜひ参考にしてみてください→国民のためのサイバーセキュリティサイト

 

 

共鳴型復元エンジン(永続学習型)

登録した辞書はブラウザに保存され、次回訪問時も引き継がれます。

復元結果:

【辞書を育てる】

※誤登録はコメント欄へ。最新の内容で上書き保存されます。

 

あなたが一生懸命登録した辞書は、あなたがブラウザの履歴を完全に削除したり、ツール側で消去命令を出さないかぎり、登録した内容は覚えていてくれます。

勝手に消えてしまう心配はほとんどありません。

 

セキュリティに関して

Cookieはネットの通信に乗ってあちこちに移動しますが、

localStorageは「その人のブラウザの中」に留まります。

そのため、余計な通信が発生せず、動作が非常にスムーズです。

 

 

最後に無二ぱんだからのお願いをお話して終わりにしようと思います。

 

管理人無二ぱんだから、プレイヤーへお願い

もし新しい単語や「これはこう読むのでは?」という発見があったら、ぜひコメント欄で教えてください。

他のプレイヤーがあなたのコメントを見て登録するかもしれませんし、

コメントの数が増えれば増えるほど、文字化けのリスト化が作り上げられていきますし、管理人無二ぱんだが初期設定に登録していけます。

 

登録完了したコメントには、ぱんだが「ぱんだマーク(はてなブログ・スター)」をつけるので、どのコメントが未登録で、どのコメントを登録したか、パッと見て判るようにします。

 

お手数ですが、あなただけの辞書を育てる片手間に、この記事のコメント欄で教え合って頂けると助かります。