JCONV(1J) — NEWS-OS Programmer’s Manual
名称
jconv − 漢字コードコンバータ
形式
jconv [ option ] [ file ] ...
jis [ file ] ...
解説
jconv は、指定した file を順番に読み込み、 漢字コードを変換して標準出力に出力します。 ファイルの指定がないときは標準入力が用いられます。
option がなければ、入力コードを自動判別し、 環境変数 LC_CTYPE または LANG の値の内部漢字コードに変換します。
option は −IO または −O の形式で次のとおりです。
I 入力コード
sシフト JIS コード
eEUC (拡張 UNIX コード)
jJIS コード (エスケープシーケンスは任意)
なし入力コードを自動判別
O 出力コード
sシフト JIS コード
eEUC (拡張 UNIX コード)
jJIS コード (デフォルト 漢字: ESC$B 英数字: ESC(J
カナ: 8 ビット 外字: ESC$(D )
j[KE][N[G]]
K = 漢字 (2 バイトコード)
BESC$B JIS X0208-1983 第 2 次規格漢字
@ESC$@ JIS C6226-1978 第 1 次規格漢字
+ESC&@ESC$B JIS X0208-1990 第 3 次規格漢字
E = 英数字 (1 バイトコード)
JESC(J JIS X0201-1976 ローマ文字
BESC(B ASCII
HESC(H スウェーデン名前用文字
N = カナ (1 バイトコード)
8JIS X0201 8 ビットコード (0xa1〜0xdf)
7JIS X0201 7 ビットコード (SO/SI を使用)
IESC(I JIS X0201-1976 片仮名
kESC(I JIS X0201-1976 片仮名
G = 外字 (2 バイトコード)
DESC$(D JIS X0212-1990 補助漢字
CESC$(C KS C5601-1987 韓国語文字
?ESC$(? その他の外字 (? は何でもよい)
小文字のオプション s、e、j、 k は、大文字 S、E、J、 K でも構いません。
jis は、JIS コードを内部漢字コードに変換するためのコマンドでしたが、 現在では jconv にリンクされています。
例
jconv −je JIS コードを EUC へ
jconv −sj7 シフト JIS コードを JIS 7 ビットコードへ
jconv −ejBBI EUC を JIS コード(JIS-83 漢字指示、ASCII 指示、JIS 片仮名指示)へ
jconv −j どんなコードでも JIS 8 ビットコードへ
注意
NEWS-OS 3.2 までに存在した −t や −v のオプションはなくなりました。 cat(1) を使用してください。
出力コード指定 j および J によるエスケープシーケンスは、ESC$B と ESC(J に変更されました。
i、I、n、 N、b、B も互換性のために残されています。 このため、 −jI は −js と同じ意味になります。 −jBJI を指定する時はこのようにするか、あるいは −jk としてください。 また、 −jBB は −b で代用できます。
ESC(H はスウェーデン名前用文字を指示するものですが、 JIS ローマ文字指示の意味で使っている端末などが存在するので 用意しています。 通常は使用しないでください。
出力を JIS コードにした場合、漢字指示後、 改行(0x0a)やタブ(0x09)などのコントロール文字、 および空白(0x20)や抹消(0x7f)を出力する前に 英数字指示のエスケープシーケンスを出しています。 これは、冗長な変換ですが、 行単位でテキストを処理する UNIX のコマンドとの親和性を良くしています。
外字領域は、 EUC では、コードセット 3 (SS3 で始まる 3 バイト)の 0x8fa1a1〜0x8ffefe で 8836(94×94)文字ありますが、 シフト JIS コードでは、0xf040〜0xfcfc で 2444(26×94)文字しかありません。 したがって、シフト JIS コードへの変換では、 変換できないコードを 0xfcfc にしてしまいます。
関連事項
NEWS-OSRelease 4.2.1R