Word、Excel、Pptなどの文書から画像を抽出する
http://princeyokoham.sakura.ne.jp/smf/index.php?topic=38076.0
Wordの文書は.docxという拡張子で表現されています。その拡張子を「名前の変更する」で.zipと変更します(警告が出るが無視でいい)。そしてzip圧縮ファイルを解凍します。(このファイルをダブルクリックする)
_rels
docprops
word
の3つのフォルダと
[Content_Types].xmlというファイルが出てきます。「word」フォルダを開くと「media」フォルダ他が出てきますが、画像はこの「media」フォルダにあります。
Excel、Pptも同様にzipと名前を変更して、解凍することで画像を抽出できます。