ただいま整理中。
Blogspot (Blogger?) に移行しました!
タイムライン | 技術系 | TIPS | ライフハック系 | その他 | 左記カテゴリ以外は、右の欄の下のタグクラウドへ!
.

2010年08月23日

ExcelVBA漢数字を数値に変換するマクロ

※[ブックマーク]ボタンの中に delicious, reddit, digg, Google+(G+) のボタンもあります。
--> Sep. 2nd, 2011追記:久々に見なおしてみたら、千、百、十などの小さなくらいの処理にバグを見つけた。修正したものを github に格納している。下記のコードも更新した。

またこの修正に伴い、新たに、壱萬などの漢字表記による漢数字もサポートする仕様追加を行った。

官公庁の発表している文書を読んでいるときに、グラフにしてみたいデータが有っ た。そのデータ部分をコピペで、Excelに張り付けていた。

ところが、そのデータは漢数字で表記されていたのだ。当然このデータは、セル 上で文字列(String)として認識される。グラフを作成するのためには、数値デー タが必要だ──漢数字を、いちいち手打ちで数値に修正するのはバカバカしい… 下向いちゃうし。

  このような思いから、Excelで、漢数字を数値に変換する方法についてぐぐってみたところ、似たようなニーズがあったようで、いくつか参考となるVBAマクロを見つけることができた。 しかし、この例の場合は
  • 4桁までの数字+位を表す漢数字という形式
  • 位が固定
  • データの指定方法がセルのみ
などの点で、一般性にかけるように思われた。   そこで、当方で
  • 二千十、二〇一〇、2千十、いずれの表記も可
  • 〇〜京の単位まで、柔軟に使用可
  • 引数は、セル、もしくは文字列いずれも使用可
  であるような、マクロ関数(Function): STRINGNUMBER を作ってみた。  

《スポンサードリンク》

Attribute VB_Name = "KanNum"
'''' KanNum.bas
'
'
'Author: mephistobooks (http://voidptr.seesaa.net)
'Date: 2010 Aug. 13
'Updated: Sep. 1st, 2011 bugfix (千, 百, 十)
'


''' as use stricts in Perl;
Option Explicit

'Private Const DEBUG_KANNUM = True
Private Const DEBUG_KANNUM = False


'NAME
'  STRINGNUMBER
'
'SYNOPSIS
'  =STRINGNUMBER(v)
'  v は、漢数字で書かれた、セルまたは文字列
'
'
'DESCRIPTION
'  漢数字を数値に変換する。数値を漢数字に変換する関数:NUMBERSTRING の逆を行う。
'  漢数字は、京の単位まで指定できる。
'  漢数字の指定方法は、セルまたは文字列で指定できる。
'  漢数字の表記は、下記の例のいずれにも対応:
'
'  例.
'       STRINGNUMBER("一九七六") => 1,976
'   STRINGNUMBER("千九百七十六") => 1,976
'        STRINGNUMBER("56万3千") => 563,000
'  STRINGNUMBER("参阡伍百萬壱拾") => 35,000,010
'
'REFERENCES
'  Q.“Excelで漢数字を数値に変換する方法を教えてください。”
'  http://q.hatena.ne.jp/1268555767
'
Public Function STRINGNUMBER(ByVal varcl As Variant) As Variant
    '''
    Dim str As String       'kanji-number string (working variable)
    Dim str_org As String   'kanji-number string (original)
    
    '
    Dim tmp As String
    
    
    ''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''
    ''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''
    ''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''
    
    '''' (0) Initialize the variables
    '
    tmp = TypeName(varcl)
    
    If DEBUG_KANNUM Then
        Call MsgBox("TypeName(varcl)[" & tmp & "]" & vbCrLf & _
                    "str[" & str & "]")
    End If
    
    
    ' Process the argument due to its type.
    If TypeName(tmp) = "String" Then
        str_org = varcl
    Else
        str_org = varcl.Value
    End If
    
    'Kanji-number string.
    str = str_org
        
    If DEBUG_KANNUM Then
        Call MsgBox("TypeName(varcl)[" & tmp & "]" & vbCrLf & _
                    "str[" & str & "]")
    End If
    
    
    ''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''
    'Algorithm:
    '
    '*Assumption
    '  assume that kanji-number string (漢数字文字列) consists of three type of
    '  number string: compound units, semi-compound units, and literal
    '  numbers.
    '
    '  compound units (京,兆,億,万) consists of semi-compound units
    '  and literal number string.
    '
    '  semi-compound units (千,百,十) consists of themselves (ex. 千十),
    '  and also they sometimes includes literal number string (ex. 3千4百).
    '
    '  literal number string (〇〜九) is able to convert to number (value)
    '  directly.
    '
    '*Way of getting the value of kanji-number string
    '  generate the expression from kanji-number string like the following:
    '    ((n_1)億)+(n_2)万+(n_3))
    '  where n_? is a*1000+b*100+c*10+d, and a-d here indicates 0-9.
    '
    '  after the step (4), we can obtain the above expression which
    '  consists from only numbers, parentheses, product(*), and addition(+).
    '
    '  and finally, the value is obtained by evaluation of the generated
    '  expression at the step (5)
    '
    
    '''' (1) Normalize the value.
    '  `normalize' means that hankaku, and all characters of
    ' [0-9],[〇-九] to [0-9].
    '
    str = StrConv(str, vbNarrow) '半角
    
    'for semi-compound units
    str = Replace(str, "拾", "十")
    str = Replace(str, "阡", "千")
    str = Replace(str, "萬", "万")
        
    'for the literal number strings.
    str = Replace(str, "九", "9")
    str = Replace(str, "八", "8")
    str = Replace(str, "七", "7")
    str = Replace(str, "六", "6")
    
    str = Replace(str, "五", "5")
    str = Replace(str, "伍", "5")
    
    str = Replace(str, "四", "4")
    
    str = Replace(str, "三", "3")
    str = Replace(str, "参", "3")
    
    str = Replace(str, "二", "2")
    str = Replace(str, "弐", "2")
    
    str = Replace(str, "一", "1")
    str = Replace(str, "壱", "1")
    
    str = Replace(str, "〇", "0")
    
    
    '''' (2) Structurize for the compound units: 京,兆,億,万.
    '
    '  (.*)兆+(.*)億+(.*)万+(.*)
    '
    str = "(" + str
    
    '
    str = Replace(str, "京", ")京+(")
    str = Replace(str, "兆", ")兆+(")
    str = Replace(str, "億", ")億+(")
    str = Replace(str, "万", ")万+(")
      
    str = str + ")"
    
       
    ''' (3) Numerize the value
    
    'semi-compound units
    str = Replace(str, "千", "*1000+")
    str = Replace(str, "百", "* 100+")
    str = Replace(str, "十", "*  10+")
    
    'compound units
    str = Replace(str, "京", "*10000000000000000+")
    str = Replace(str, "兆", "*    1000000000000+")
    str = Replace(str, "億", "*        100000000+")
    str = Replace(str, "万", "*            10000+")
    
    
    ''' (4) correct the expression of the value.
    str = Replace(str, "()", "0")
    
    str = Replace(str, "++", "+")
    str = Replace(str, "+)", "+0)")
          
    str = Replace(str, "(*", "(1*")
    str = Replace(str, "+*", "+1*")
    
    If DEBUG_KANNUM Then
        Call MsgBox("org:" & str_org & vbCrLf & "str:" & str)
    End If
    
    
    ''' (5) Eval the generated expression!
    STRINGNUMBER = Application.Evaluate(str)
    
End Function

各構成単位ごとに、丸括弧でくくることが、みそだ。 最終的に、漢数字部分は数字に置き換えられ、数式の形になる。そして、それがApplication.Evaluate()により、数値に変換される。

Have fun!!

posted by もふもふ at 21:15 | ロンドン ☁ | Comment(2) | TrackBack(1) | カテゴリ: 技術 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
はじめまして。
法律の条文の漢数字をアラビア数字に変換するために使いました。
たいへんありがとうございました。
Posted by 西田 at 2013年02月09日 02:46
あわわ。1年以上前にコメントいただいてました。
お役に立てたようで、なによりです。
法律の条文の変換に使われたんですね。
Posted by 管理人 at 2014年05月02日 09:25
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック

VBAのドキュメントの目次一覧
Excerpt: Microsoftのヘルプ機能は、OSのそれにしろOfficeアプリケーションのそれにし ろ、まったくひどいしろものだ。なにしろ、知りたい検索しても当該ページがで てこない。 また、このヘルプ・ドキュ..
Weblog: Idea, Design, Engineering, Architecture, etc
Tracked: 2010-08-28 04:51
トラックバックURLは,"Trackback(x)"のリンクを押すと表示されます.
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。