|
2.12.10 文字列の検索と読込み
Readや Find等の関数は,外部ファイルから読み込むテキストやデータを処理するのに使われることが多い.しかし,場合によっては,これらの関数をMathematicaの中で文字列を処理するのに使うと便利なこともある.これには関数 StringToStreamがあり,入力ストリームを開くが,外部ファイルからでなく,Mathematicaの文字列から文字を取り出す.

文字列を入力ストリームとして処理する
文字列から読み込むために入力ストリームを開く.
In[1]:= str = StringToStream["A string of words."]
Out[1]= 
その文字列から初めの「ワード」を読む.
In[2]:= Read[str, Word]
Out[2]= 
文字列から残りのワードを読み込む.
In[3]:= ReadList[str, Word]
Out[3]= 
入力ストリームを閉じる.
In[4]:= Close[str]
Out[4]= 
文字列からの入力ストリームはファイルへのストリームと同様に機能する.任意の時点で,ストリームにおいてカレントポイントが設定され,それは Read等の関数が実行されると移動する.カレントポイントの位置は,関数 StreamPosition[stream]によって文字列の先頭からのバイト数を表す整数で示される.SetStreamPosition[stream, n]を使って明示的にカレントポイントの位置を設定することができる.
文字列から読み込むために入力ストリームを開く.
In[5]:= str = StringToStream["123 456 789"]
Out[5]= 
カレントポイントは初め文字列の先頭から0バイトの位置にある.
In[6]:= StreamPosition[str]
Out[6]= 
ストリームから数を読む.
In[7]:= Read[str, Number]
Out[7]= 
カレントポイントは文字列の先頭から3バイトの位置に移動した.
In[8]:= StreamPosition[str]
Out[8]= 
カレントポイントを文字列の先頭から1バイトの位置に移す.
In[9]:= SetStreamPosition[str, 1]
Out[9]= 
ここで文字列から数を読み込めば,123のうち 23の部分が読まれる.
In[10]:= Read[str, Number]
Out[10]= 
カレントポイントを最後尾に移す.
In[11]:= SetStreamPosition[str, Infinity]
Out[11]= 
ストリームから何かを読み込もうとすると,EndOfFileを得る.
In[12]:= Read[str, Number]
Out[12]= 
ストリームを閉じる.
In[13]:= Close[str]
Out[13]= 
特に大量のテキストデータを処理するときは, Mathematicaに長い文字列を読み込ませることが普通で,この場合 StringToStreamを使うと Mathematicaの中でこの文字列を処理することができる.StringToStreamを使って一度入力ストリームを開けば,文字列を読んだり検索したりするのに,ファイルの項で述べたどの関数でも使うことができる.
textfileのすべての内容を文字列に変 える.
In[14]:= s = First[ ReadList["textfile", Record, RecordSeparators -> {}] ]
Out[14]= 
その文字列に対して入力ストリームを開く.
In[15]:= str = StringToStream[s]
Out[15]= 
文字列中の isを含む行を探し出す.
In[16]:= FindList[str, "is"]
Out[16]= 
カレントポイントを文字列の先頭に再設定する.
In[17]:= SetStreamPosition[str, 0]
Out[17]= 
文字列の中に現れる最初のtheを探し出し,その直後にカレントポイントを移動する.
In[18]:= Find[str, "the", RecordSeparators -> {" "}]
Out[18]= 
その位置の直後にあるワードを読み込む.
In[19]:= Read[str, Word]
Out[19]= 
入力ストリームを閉じる.
In[20]:= Close[str]
Out[20]= 
|