スポンサーサイト

一定期間更新がないため広告を表示しています

| スポンサードリンク | | - | - |
Entry: main  << >>
「全角チルダ」と「波ダッシュ」
「〜」をウェブページの入力欄に入力してみると「ギザギザの〜」に変換される時がある(サイトによる)。それをコピーして「メモ帳」にペーストしてセーブしようとすると下記の注意が出てくる。

Aコピー
「このファイルは、ANSIテキストファイルとして保存すると失われてしまうUnicode形式の文字を含んでいます。Unicodeの情報を保存するには、下の[キャンセル]をクリックし、[文字コード]から[Unicode]を選択してください。続行しますか?」(Vistaの場合)

Bコピー
「このファイルは、ANSIテキストファイルとして保存すると失われてしまうUnicode形式の文字を含んでいます。Unicodeの情報を保存するには、下の[キャンセル]をクリックし、[文字コード]から[Unicode]を選択してください。続行しますか?」(Vistaの場合)

「ギザギザの〜」を消して、「〜」を再入力してセーブすると、上の注意は出てこない。何が起こっているのだろうか?

ANSIとは何だろうか? Unicodeとは?

ASCII(アスキー):American Standard Code for Information Interchange
ANSI:American National Standards Institute(ANSI、アンスィー、米国規格協会)。日本の日本工業規格 (JIS)のようなもの。

ASCIIは、1963年6月17日に、American Standards Association(ASA、後の ANSI)によって制定された。当時の規格番号は ASA X3.4 、現在の規格番号は ANSI INCITS 4 である。ANSI INCITS 4-1986 (formerly ANSI X3.4-1986) American National Standard for Information Systems ― Coded Character Sets ― 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII), American National Standards Institute (1963年6月17日制定, 1986年3月26日最終改正, 2002年1月15日規格番号変更).
(ja.wikipedia.org)

「シフトジスで保存されたものがジスに変換されてメール送信される」と以前言っていた。今は?

●「全角チルダ」というのはおかしな用語である

インターネット上のページの入力欄に「〜」を入力して見てみると、その「〜」の部分だけ汚いフォントになっているのが、そもそもの疑問というか、不満なことだった。つまり、こういうことだ。

「」が「」みたいに見える。ギザギザである。ジャギーである。

で、調べてみるとこの問題についてはインターネット上には沢山の解説があって、事情は、まあ、なんとなくは分かった。そのうちに、Windows Vistaを使うようになって「〜」が綺麗なフォントで見えるようになり、これでいいかも、と思うようになった。でも、このVistaの解決策というのが、違うコードの記号を同じように見えるようにする、という「それでいいのか?!」と思うような解決法であって、それが嫌なら「メイリオ」や「MSゴシック」とかのデフォルトじゃないフォントを別にインストールして使ってね、というものだった。うーむ、ではある。

そもそも僕がなぜ「〜」を使うかというと、これは長音記号「ー」の変種のつもりであって、

「みっくみっくにしてやんよ〜」

みたいな使い方である(笑い)。また、この記号は数字の範囲などを表現するときもつかう。「2月から5月までは花粉症で」という内容を「2月〜5月までは花粉症で」と表記したりする。日本語記号の保守的な使いからすると「〜」を長音記号として使うのはややふざけたきらいがあるが、「2月〜5月」みたいな使い方は、まっとうな使い方と言ってよいと思う。

ということで「〜」という記号である。これはなんと呼ぶべきか。呼称は何なのか。僕が今使っている「Microsoft IME スタンダード2003」では、この記号には「[全]波型」という名称が付いていて、「から」「にょろ」という仮名からも変換できるようになっている。また、この記号には、

Unicode:0xff5e
JIS:0x2141
シフトJIS:x8160
区点:00133

という説明が付いている(「Microsoft IME スタンダード2003 9.0.6358.0」)。

画像


FULLWIDTH TILDE(全角チルダ)というのはユニコードでの用語である。
FULLWIDTH TILDE → http://www.unicode.org/charts/PDF/UFF00.pdf
WAVE DASH → http://www.unicode.org/charts/PDF/U3000.pdf

http://www.geocities.jp/toolzroom/char/12288-12343.html
文字参照一覧 12288-12343
〜, &#12316

(&tilde;) 「˜
SMALL TILDE U+02DC (&#732; &tilde;) 「˜
TILDE U+007E (&#126;) 「~
FULLWIDTH TILDE U+FF5E (&#65374;) 「
WAVE DASH U+301C (&#12316;) 「

「から」を変換して入力したもの 「
=キーの右にある~キーを押して入力したもの 「~

波ダッシュ(なみダッシュ、swung dash)とは、約物のひとつで、波線「〜」のことである。ダッシュ(—)の波形であることからそう呼ばれる。しばしば音声記号のチルダ(~、〜)と混同・混用されるが、誤用である。

波ダッシュ(U+301C, WAVE DASH)は“下がって上がる”形「」で表示される。
全角チルダ(U+FF5E, FULLWIDTH TILDE)は“上がって下がる” 形「」で表示される。
W型の(U+3030, WAVY DASH)「」というものもある。

http://oshiete1.goo.ne.jp/qa3477069.html
「全角チルダ」と言われた「〜」が正しい波ダッシュであり、スワングダッシュです。
​http://encarta.msn.com/dictionary_/swung%2520dash.html​
​http://dictionary.reference.com/browse/swung%20dash​
Wikipediaの説明は正確ではありません。
Unicode Standard が間違って和文縦組み用の波ダッシュをそのまま90度回転した“鏡文字”をU+301Cに定義してしまったために、​http://www.unicode.org/charts/PDF/U3000.pdf​ 2ページ目
それに準拠したXPまでのMS書体では“谷”が先で“山”が後になっています。
こんな鏡文字は欧米には存在しませんし、必要なかったのです。
VistaのMS書体ではそのことに気付いて、“山”が先で“谷”が後の正しいスワングダッシュ「〜」の形に訂正されました。
ですから、XPで苦労して環境依存文字の鏡文字を使っても、そのデータをVista以降のOSで表示すれば、「〜」と同じ形になってしまうのです。


http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1012154365
〜 ←これって何の文字ですか?
〜 とは違うみたいなのですが。
いえいえ、「〜」ではないですよ。よぉ〜く見てください。
なんかゲジゲジしていますよね。
別のところから「〜」をコピペしました。
「〜」と同じに見えるようでしたら、コピペして確認してくださいまし。

回答日時: 2007/7/12 23:00:07 編集日時: 2007/7/12 23:20:03 回答番号: 38,888,524
お使いのPCはXPまたはそれ以前ですね。
Unicode Standardの誤りのため、XPまでのMS明朝ではUnicode:U+301Cに「〜」の鏡文字『〜』が登録されていました。http://www.unicode.org/charts/PDF/U3000.pdf 2ページ目
質問者さんのPCではそのように表示されているのでしょう。

http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1311133088
回答日時: 2007/3/24 11:46:44 編集日時: 2007/3/24 13:12:25 回答番号: 35,924,026
「〜」はUnicode:301Cで、XPまでのMS書体 (明朝Version 2.31/ゴシックVersion 2.30) では「〜」の鏡文字になっていましたが、VistaのMS書体 (明朝/ゴシックVersion 5.0) で「〜」の字形に変更されました。

http://ja.wikipedia.org/wiki/Unicode
○WAVE DASH - FULLWIDTH TILDE問題
JIS X 0221規定のJIS X 0208とJIS X 0221の対応表では、波ダッシュはWAVE DASH (U+301C, "〜") に対応させているが、

○波ダッシュ(〜)問題
http://ja.wikipedia.org/wiki/%E6%B3%A2%E3%83%80%E3%83%83%E3%82%B7%E3%83%A5
Unicodeに関連する問題
このような間違いが発生した理由は、Unicodeの例示字形を検討するグループにいたメンバーの日本語に対する知識が不十分だったために、

http://www.masuseki.com/index.php?u=interest/manga/060615_namidash.htm
「モーニング」で倏肇瀬奪轡絖瓩使われてる件
波状の音引きを強波ダッシュとして処理するという今までのルールって、猗楼呂鮗┐垢燭瓩稜肇瀬奪轡絖瓩鉢牴三きを示すための波ダッシュ瓩魘菠未垢襪里鯡榲として生まれたルールだと思うんですね。 その趣旨はもっともであり、今からそのルールを撤回するのは混乱を招く危険もあるかと思いますが‥‥ でも、波ダッシュと強波ダッシュを使い分けられるというのは、いちマンガ家としてはよろこばしい、というかモーニングで描いてる作家がうらやましいんですよね。

http://forum.mozilla.gr.jp/?mode=al2&namber=3761&rev=&&KLOG=26
Mac では全角チルダを Unicode の U+301C (&#12316;)
で受け取ります。それを保存するときに Shift_JIS に
変換するのですが、実は Mozilla が使う変換テーブルは
Windows のそれに合わせてあって、U+301C に対応する文字は
Shift_JIS に存在しないことになっています。
そのとき Mozilla は数値文字参照に置き換えてしまいます。
これは特定の文字を番号を決めて指示する HTML の規則です。
HTML 4 以降ではこのときも Unicode を使うことになっていて
Unicode での U+301C がそのまま(16進法から10進法に変えて)
&#12316; と書いてしまいます。

Windows の IE がそれを受け取ったときは、
Shift_JIS から Unicode に変換する訳ですが、
Shift_JIS の全角チルダは U+FF5E (&#65374;)に変換します。
それを数値文字参照の場合は変換なしに文字を表示し、
そこに &#12316; と書いてあれば Unicode から文字を、
しかし Shift_JIS の全角チルダとは別の、を探してきます。
それが全角チルダを逆にしたような文字です。
Windows の IE で全角チルダを表示させたければ
全角チルダを直接埋め込むか &#65374; と書くしかありません。
しかし &#65374; と書けば IE Macintosh Edition で
おかしな表示になるはずです。
全角チルダを直接書くのがよさそうです。

http://bsakatu.s201.xrea.com/mt/2007/02/11/04-51-48
Unicodeの仕様書では、U+301C WAVE DASH(波ダッシュ)に、「JIS punctuation」(The Unicode Standard, Version 2.0より引用, 「JIS約物」の意)という注釈を施しておきながら、JIS X 0208の波ダッシュの例示字形(“上がって下がる” 形「」)とは異なる形(“下がって上がる”形「」)を印刷してしまった。 このような間違いが発生した理由は、Unicodeの例示字形を検討するグループにいたメンバーの日本語に対する知識が不十分だったために、縦書きの例示字形「」を90度回転すればいいと誤って判断してしまったためである。なお、この縦書きの字形については特に混乱は見られない。
この影響を受けて、Microsoft Windows(XP以前)ではUnicodeの波ダッシュ(U+301C, WAVE DASH)は“下がって上がる”形「」で表示される(MS 明朝、MS ゴシック、MS UI Gothicにおけるもの)。それに対し、Shift_JISの波ダッシュ(0x8160, WAVE DASH)はUnicodeの全角チルダ(U+FF5E, FULLWIDTH TILDE)と共通の文字として扱われた上で“上がって下がる” 形「」で表示されるようになっている。
Windows XPや2000で波ダッシュをシフトJIS入力した場合、テキストデータには「0×8160」と記録されます。では、このテキストをあらためてユニコードで保存し直したらどうなるでしょうか。

http://www.informe.co.jp/useful/character/character14.html
 ユニコードでは、「波ダッシュ」(WAVE DASH)に「U+301C」というコードポイントが割り当てられていますから、規定どおりであれば「U+301C」と記録されるはずです。ところが、Windowsのユニコード対応アプリケーションでユニコード保存すると、波ダッシュは「U+301C」ではなく、なぜか「U+FF5E」というコード番号で保存されてしまうのです。
 「U+FF5E」というのは、波ダッシュではなく、「全角チルダ」を表すコードポイントです。チルダというのはキーボードの右上のキーで入力する記号で、欧文書体(半角文字)だと字面の上に小さく表示される波状の文字です。書体によっては全角チルダと波ダッシュはほとんど変わらない形をしていますが、意味としてはまったく違うものです。
 もっとも、DTPでは、シフトJISで入力している限り波ダッシュが全角チルダになってもそれほど大きなトラブルは起きないでしょう。Macintoshの標準フォントやモリサワフォントなどでは波ダッシュ(U+301C)と全角チルダ(U+FF5E)は同じ形をしているので、どちらであっても文字化けする心配はありません。問題なのはWindows上で波ダッシュをユニコード入力した場合です。

http://ja.wikipedia.org/wiki/Wikipedia:%E8%A1%A8%E8%A8%98%E3%82%AC%E3%82%A4%E3%83%89
固有名称などでやむを得ず波ダッシュを使用する際には、原則として「〜」(Unicode: U+301C)を用い、全角チルダ「〜」(Unicode: U+FF5E)、チルダ「~」(Unicode: U+007E)は使用しないでください。全角チルダ「〜」 (Unicode: U+FF5E) は、非Windows環境の場合には表示されないことがあるため使用を推奨しません。また、波ダッシュ「〜」(Unicode: U+301C)もフォントによっては上下逆の波形で表示されることがありますので、必要最小限に用います。(波ダッシュ「〜」(Unicode: U+301C)は、Windows環境では、通常のキーボード入力ではなくWikipedia編集画面の投稿ボタンの下にある「記号」の中の「〜」を選択する方法で入力してください。「文字コード表」か「IMEパッド」から文字コードを選択する入力方法や、日本語入力システムの単語登録機能を利用する方法、記事本文であれば「&#12316;」という入力で表記する方法もあります)。

http://echoo.yubitoma.or.jp/weblog/ClapHand/eid/540462/
ちなみに、Windows 付属の MS IME ( 日本語入力システム ) で、「から」と打ち込んで変換すると、「〜」( 全角チルダ ) に誤って変換されるが、本来は「〜」(波ダッシュ)に変換されるべきある。

http://huemat.at.webry.info/200709/article_1.html
波ダッシュ問題。TILDE(チルダ、~)はASCIIにはあるが、JIS X 0208には対応する文字がない。ないのだが、Windowsの実装では、JISの「波ダッシュ」(1区33点)をTILDEと同一視して、Unicodeの「FULLWIDTH TILDE」(U+FF5E)に対応させている。ところがUnicodeでは、JISの波ダッシュに対応する「WAVE DASH」(U+301C)が用意されているので、こちらに対応させるのが正しい。正しいのだが、何故かUnicodeの仕様書ではこの波ダッシュが上下逆に印刷されてしまっており、話がすっかりややこしくなってしまった。このU+301Cについては、Windowsの標準フォントでは、XPまでのバージョンではUnicodeの仕様書通り(上下逆)で作られていたが、VistaバージョンからはJISの仕様書通りに作られるようになった(つまり、「WAVE DASH」と「FULLWIDTH TILDE」の見た目は同じになった)。

参考URL:
従来の文字コードとUnicodeの対応に関する諸問題
http://euc.jp/i18n/ucsnote.ja.html
JIS漢字とUCS (Unicode)の文字の対応・変換について
http://www.asahi-net.or.jp/~wq6k-yn/code/jisucs.html

波ダッシュはチルダではない
コード変換において、JIS X 0208/0213の波ダッシュ「〜」(1面1区33点、シフトJISでは8160)をUnicodeの「FULLWIDTH TILDE」(U+FF5E)にうつす実装は不適切である。適切な変換先はWAVE DASH (U+301C)である。以下に理由を述べる。

http://www.asahi-net.or.jp/~wq6k-yn/code/wavedash.html
波ダッシュはチルダではない
コード変換において、JIS X 0208/0213の波ダッシュ「〜」(1面1区33点、シフトJISでは8160)をUnicodeの「FULLWIDTH TILDE」(U+FF5E)にうつす実装は不適切である。適切な変換先はWAVE DASH (U+301C)である。以下に理由を述べる。

JISの規格では「〜」は「波ダッシュ」と記述されており、文字名称は WAVE DASHと規定されている。よってUnicodeのWAVE DASHに対応すると考えるのが妥当。UnicodeのもとになったJIS X 0208-1990においてもやはり「波ダッシュ」であった。チルダではない。
区点の並びからも、ダッシュやハイフンのような一般の記述記号の中にあり、チルダが属すべきダイアクリティカルマークとは離れている。
Unicode仕様書のWAVE DASHの説明には「JIS punctuation」と書いてあり、 JISの波ダッシュと対応させる意図がみえる。
JIS X 0208の拡張であるJIS X 0213ではWAVE DASHとは別にTILDEを追加した(1面2区18点)。これは波ダッシュとチルダとは別という文字認識にほかならない。ASCII と同時運用する際(EUC-JISX0213、ISO-2022-JP-3等)にはこの新設チルダが「FULLWIDTH TILDE」となる。なお、補助漢字JIS X 0212でもやはりチルダが追加されていたことも参考になる。
波ダッシュを縦書きでレンダリングする際、線の両端が上下にくるように倒した形で表現することは普通に行われている。「〜」を「FULLWIDTH TILDE」にうつすWindowsにおいてすらそうである。もしこれが本当に「チルダ」であるなら、縦書きであろうと向きを変えずにレンダリングしなければならない。チルダと同種の記号であるダイアレシス「¨」やサーカムフレックスアクセント「^」は縦書きでも横転せずにレンダリングされているのだから。

あるいは、WindowsのUnicodeにおいてはU+FF5EがFULLWIDTH TILDEではなく WAVE DASHなのだという解釈もあり得る。そうならば上のような矛盾はなくなる。しかし、そのような「Windows独自のUnicode」が大きな非互換性を産むことは間違いがない。実際、どう解釈するにせよ、Windowsのこの変換表の矛盾のために、Javaプログラムなどで現に文字化けが生じているのだから。
| tomokazu2006 | 20:31 | - | - |
スポンサーサイト
| スポンサードリンク | 20:31 | - | - |

Calendar

   1234
567891011
12131415161718
19202122232425
262728293031 
<< March 2017 >>

Sponsored Links

Profile

Recommend

Search

Entry

Archives

Category

Feed

Others

無料ブログ作成サービス JUGEM

Mobile

qrcode