C言語関数:_ismbblead





C言語のページでは、次の内容を解説しております。
C言語の入門講座  C言語の文法を中心に、基本的な関数などの解説をしています。
C言語ケーススタディ  C言語での実践的なプログラミングについて解説をしています。
C言語の関数リファレンス  C言語で用意されている関数を解説しています。
C言語で3次元動画プログラム  C言語で3次元タートルグラフィックを使用した3次元の動画プログラムの作成例です。
C言語の検定試験  C言語の文法に関する検定試験を実施することができます。
C言語でゲーム作成  C言語を使用したゲームの作り方を解説したページも用意しております。



2014年10月より個人の方を対象に、Study C無料提供を開始しました。
C言語を勉強中の方は、学習・教育に最適なC言語インタープリタのStudy Cを使ってみてください(個人の方は無料です)。
大学・高専・高校などの教育機関での採用実績も多数あるロングセラー商品Study Cが、個人向けに無料提供を始めました。
インタープリタの手軽さに加え、ゲームや3Dタートルグラフィックで楽しく勉強したりと、C言語の学習を協力にサポートします。
ブロック崩しゲーム 3Dツリー クリスマスツリー
また、このようなボタンの用意されているページでは、掲載しているプログラムをStudy Cに直接ロードし実行したりすることができます。
Study Cにロードする Study Cにロードし編集する Study Cにロードし実行する
Study C無料利用についての詳細は、このページを参照してください。




■_ismbblead
cが漢字の1バイト目か判定

【分類】
日本語対応文字関数

【書式】
int _ismbblead(unsigned int c);

【パラメータの型と説明】

パラメータ説明
unsigned int c文字

【機能説明】
文字cがマルチバイト文字の1バイト目(0x81 - 0x9F/0xE0 - 0xFC)であれば0以外の値を返します。
それ以外の場合は0を返します。

Study Cを使用している場合は、下記のようにコマンドラインから実行(exprコマンドを使用)して動作を確認することができます。

C:\StudyC\MyProg>expr _ismbblead("Aあア亜"[0])
<int>0 0x0

C:\StudyC\MyProg>expr _ismbblead("Aあア亜"[1])
<int>4 0x4

1番目は半角文字なので0になります。
2番目は全角文字の1バイト目なので0以外となります。
↑カーソルキーを押すと入力したコマンドが呼び出されるので0、1の部分を変更して続けて試してみてください。

C:\StudyC\MyProg>expr _ismbblead("Aあア亜"[3])
<int>4 0x4

C:\StudyC\MyProg>expr _ismbblead("Aあア亜"[4])
<int>0 0x0

C:\StudyC\MyProg>expr _ismbblead("Aあア亜"[5])
<int>4 0x4

C:\StudyC\MyProg>expr _ismbblead("Aあア亜"[6])
<int>4 0x4

3から5番目までは予想通りだったと思います。
6番目はどうだったでしょうか?
全角文字2文字目なのに0以外となっています。 これは、漢字コードの1バイト目と2バイト目に重複している部分があり_ismbblead()関数は単に文字コードの範囲を調べているだけだからです。 それでは2バイト目も調べればOKかについては、_ismbbtrail()関数で解説します。

通常のコンパイラを使用する場合の使用例は下記になります(もちろんStudy CでもOKです)。

#include <stdio.h>

main()
{
        printf("%d\n", _ismbblead("Aあア亜"[0]));
        printf("%d\n", _ismbblead("Aあア亜"[1]));
        printf("%d\n", _ismbblead("Aあア亜"[3]));
        printf("%d\n", _ismbblead("Aあア亜"[4]));
        printf("%d\n", _ismbblead("Aあア亜"[5]));
        printf("%d\n", _ismbblead("Aあア亜"[6]));
}

ちょっとどの行の結果かわかりにくいですが、実行結果は以下になります。

0
4
4
0
4
4

ところで、この関数はTRUEとして4(1とか-1ではなく)という中途半端な値が返してきます。 これはC言語でよく使われるテクニック(少しでも処理スピードを早くする為)によるものです。
このテクニックは、サイズ256バイトの配列を作成し_ismbblead()関数なら65〜127番目(0x40〜0x7Eに対応)などTRUEとなるべき配列の要素に値に4をセット(static変数とし初期化)しておきます。 そして、チェックしたい文字コードの位置の配列の値がそのままTRUEかFALSEの結果となっています。
また、TRUEの時返される値が1ではないかというと、チェック用の配列を幾つかの関数で使いまわしているからです。 共通の配列を使う為には関数ごとに1、2、4、8、...と値を割り当てておき最後にand演算を行います。 _ismbblead()関数には4が割り当てられているため、TRUEの場合は4が返されます。
このテクニックに関しては、isalpha()関数で詳しく説明しているので参照してください。

【参照関数】
_ismbbtrail
_ismbbkana

【使用例】
C言語ケーススタディ 全角文字の処理方法
C言語ケーススタディ 全角/半角混じり文字列の文字数
C言語ケーススタディ 全角/半角混じり文字列内の文字検索