Mac OS でコマンド ラインからファイル エンコーディングを判別する方法
目次:
Mac OS (および Linux) のコマンド ラインから「file」コマンドを使用して、ファイルのエンコーディングと文字セットを特定できます。これは、ファイル タイプに関する一般的および特定の情報を取得するのに役立ちます。
これはおそらく多くのユーザーにとって重要なヒントではありませんが、何かのために特定の文字セットを使用する必要がある場合、またはファイルの種類、エンコーディング、または文字を知る必要がある場合入力されたアイテムのセットはコマンドライン経由である場合、これでうまくいきます。
file コマンドは Mac OS と Mac OS X だけでなく、Linux や他の多くの UNIX バリエーションでも機能するため、このトリックはスクリプトや他の同様の目的にも役立ちます。
Mac OS のコマンド ラインからファイル エンコーディングと文字セットを決定する
基本的な構文は次のとおりです。
file -I (入力ファイル)
(わかりにくい場合は、小文字の L ではなく、-I のようにフラグとして大文字の「i」を使用します)
適切なファイル名を入力して return を入力すると、UTF-8、us-ascii、binary、8bit などの文字セットが明らかになります。
たとえば、「text.txt」という名前のファイルの文字セットとファイル エンコーディングをチェックすると、構文は次のようになります:
ファイル -I text.txt text.txt: text/plain; charset=unknown-8bit
「text/plain」はファイル タイプで、「unknown-8bit」は文字セット ファイル エンコーディングです。
file コマンドは、イメージ、アーカイブ、実行可能ファイル、またはコマンドを指定したいその他のファイルなど、文字通り他のファイルに対して発行することもできます。これは、ファイルの種類を検出して適切なコマンドを実行する何かを自動化する場合に便利です。たとえば、curl を使用してファイルをダウンロードし、適切なコマンドを実行する前にアーカイブの種類を決定する必要がある場合などです。
ファイル -I DownloadedFile.zip DownloadedFile.zip: application/zip; charset=binary
'file' コマンドを使用してコマンド ラインから文字セット、ファイル エンコーディング、およびファイル タイプをチェックするには、他にも多くの用途があります。-I フラグは、利用可能なさまざまなオプションの 1 つにすぎません。 .興味がある場合は、 file のマニュアル ページをチェックして詳細を確認してください。また、他の多くのコマンド ラインのヒントも忘れずにチェックしてください (または、Mac で使用できるすべてのターミナル コマンドを一覧表示して、少し楽しんでください)。
Mac OS のコマンド ラインからファイル エンコーディングと文字セットをチェックする別の方法またはより良い方法をご存知ですか?コメントでお知らせください!