文字列を頭からバイト数で切り出す
4D v17
文字数ではなくてバイト数?
もともとコンピュータはバイトの世界、全角も半角も文字数を間違わずに計算してくれているので今は意識することが少なくなった。いまどきバイト数を気にするのはC言語使ってるプログラマが構造体のオフセットを考えている時だけかもしれない。
4D v17には文字列の長さを取得するコマンドはある。Lengthだ。文字数を返す。全角・半角混じりの場合はうまいこと文字数を返す。ただしその文字数が何バイトかわからない。文字列の長さをバイト数で取得したい、ということでコマンドを探してみたら、ない。
そこで文字列のバイト数を返すメソッド「zz_byte_Substring」を作ってみた。ので紹介する。全角半角が混じるので全角文字の途中で切ることをしないとすれば実際は30バイトちょうどにはならない、という仕様はご承知いただきたい。
実装のポイントはバイト数を返すだけのメソッド「zz_byte_GetLen」を別モジュールにしたこと。
//zz_byte_GetLen//文字列のバイト数を返す
C_TEXT($1;$inStr)
$inStr:=$1
C_LONGINT($0;$sizeOfBlob)
$sizeOfBlob:=$0
C_BLOB($blob)
TEXT TO BLOB($inStr;$blob)
$sizeOfBlob:=BLOB size($blob)
$0:=$sizeOfBlob
このプログラムでバイト数を計算する。BLOB型の変数に代入してBLOB sizeを使った。
図2
zz_byte_GetLenは、(半角文字数 x 1) + (全角文字数 x 2) + 1を返すみたいだ。おそらく最後の1バイトは文字列の終端を示す区切り文字だと思われる。呼び元のメソッドzz_byte_Substringでは、この文字を含めて上限バイト数とする。上限バイト数は引数でもらうようにした。whileループで文字列を一文字ずつ少なくしていって、30byte以下になったところで止めれば良い。
次のようなコード。
//zz_byte_Substring//20200317 wat
//指定されたバイト数で、文字化けしないように文字列を切る。
C_TEXT($1;$inStr)
$inStr:=$1
C_LONGINT($2;$inByteLen)
$inByteLen:=$2
C_TEXT($0;$outStr)
$outStr:=$inStr
C_LONGINT($byteLen)
//バイト数を取得
$byteLen:=zz_byte_GetLen ($outStr)
$outStr:=$inStr
While ($byteLen>$inByteLen)
//文字を一つ減らして、バイト数を取得
$outStr:=Substring($outStr;1;Length($outStr)-1)
$byteLen:=zz_byte_GetLen ($outStr)
End while
$0:=$outStr
これでバイト数で切り出すメソッド完成。