PDFの表をhtmlテーブルタグに変換する方法(Word・Excel・WEBツール)
PDF形式でもらった表データをhtmlのtableタグソースに変換する方法をご紹介します。
一旦Wordに変換し、Excelのセルにコピペ、WEBツールでhtmlソースに変換する流れです。
PDFはアウトラインのものでも変換される事が多く、大変便利です。
PDFの表をhtmlのtableデータに変換する方法
PDFになっている様々な表データをWEBページに掲載する事ってよくありますよね。
表はそのまま画像として載せるより、htmlソースに直接tableデータとして表示するべきでしょう。
この時PDFの数値を一つ一つ、直接tableタグ内に入力していくのは結構手間が掛かります。
本記事で紹介する方法を使えば、tableタグのソースになった状態でコピペしてくる事ができるので、後はタグを整理するだけです。
手順も非常に簡単ですのでご紹介していきますね。
PDFをそのままWord形式で開く
変換したい表データの入ったPDFを、まずはWord形式で開きましょう。
右クリックメニューから、「プログラムから開く」→「別のプログラムから選択」→「Word」
最初に表示されている一覧の中にWordがなくても、空白部分をクリックするとソフトがさらに表示されます。
もしくはWordファイルを新規作成して、そこから対象のPDFファイルを開く形でも大丈夫です。
Wordによる変換
下の様なガイダンスが表示されますので、OKを押しましょう。
PDFの内容によっては処理に時間が掛かる場合がありますので、「OK」が押せるようになるまで待ちましょう。
OKが押せたら、開いた内容を確認しましょう。
ポイント:アウトライン化PDFについて
PDFにはアウトライン化されてないものとアウトライン化されたものとあります。
アウトライン化されている場合、PDF上のテキストや表データはドラッグで選択する事ができませんよね。
一見難しそうですが、この状態でもWordファイルで開く際に変換される場合が多いです。素晴らしい事です。
ただし完璧にトレースできていない場合もありますので、データが変換されているどうかは確認する必要があります。
表データ部分をExcelに張り付ける
tableタグソースにしたい表データ部分を探します。
データの左上端にある+マークを選択して、右クリック「コピー」をしましょう。
次にExcelファイルを新規で開き、右クリック「貼り付け」をしてペーストしてきます。
変換予定の表データが表示されました。
PDFを直接Excelで開くことはできない
ここまでPDF→Word→Excelという工程を進んでいますが、PDFを直接Excelで開くことはできません。
ですので一旦Wordファイルに変換したものをExcelに張り付けています。
Excelに変換する事で次に紹介する変換ツールが利用できるようになります。
Excelのデータをtableタグに変換してくれるWEBツール
Excelのデータをtableタグに変換してくれるWEBツールです、下記URLを開きましょう。
ExcelからHTMLテーブルタグ変換:https://ao-system.net/exceltable/
表データのセルを範囲選択・コピペ
先ほどのExcelの表データセル部分を全部選択して「コピー」します。
WEBツール上の黄色いマスの中で「貼り付け」すると、データが表示されます。
このまま下にスクロールすると、広告欄の下部分に「結果のプレビュー」の欄がありますので、そこで状態を確認しましょう。
表内のセル内容は修正できる
上の黄色のマス内で、元データの数値変更ができます。
ですのでExcel上で変更してコピペし直さなくても大丈夫です。
htmlテーブルソースの表示
「結果のプレビュー」のさらに下に、「結果のHTMLコード」の欄があります。
ここにtableソースに変換された情報が表示されています。
このtableソースをコピペして、htmlタグ上に張り付ければ完了です。
ツールオプション
htmlソースに変換する際、様々なオプションが用意されています。
オプションを選択すると、ソースが加工されます。
インデント
・改行をしない
・インデントなし
・スペース1個
・スペース2個
・スペース4個
・タブ
改行をしない
改行やスペースが一切入らない羅列された状態になります。
いわゆるminファイルの様な感じですね。
インデントなし
改行後のスペースが一切入らない状態になります。全て左端に寄った状態です。
スペース1個~4個
各タグ前のスペースの入り方を調整できます。
タブ
各タグ前にタブが一つずつ入った状態になります。
タグの改行
・trとtdを同一行
・trとtdは別行
trとtdを同一行
trとtdの間に改行が入らず、連続した記述になります。
trとtdは別行
trとtdの間が一段改行されます。
テーブル表現
・tabke tr td
・div dl dd
・div ul li
さらにtableタグ以外に「div dl dd」形式「div ul li」形式でも出力できます。
まとめ
以上PDFデータをtableタグへ変換する方法をご紹介しました。
大変便利ですし時間も掛かりませんね。何よりアウトライン化されたPDFでもtableデータにできるのは大きいです。
データを表タグに変換するのは大変です
基本的にクライアントから提供いただく素材は、データ(コピペ可能なもの)でもらうのが普通です。
しかしテキストと違って、表データだけはhtmlのテーブルタグに整形しなければなりません。
今回の様にWordやExcel・PDFの表データを、即tableタグに変換できれば時間短縮につながります。
今回は一つの方法であり、変換方法は他にもたくさんあると思います。
もっと工程をショートカットできる方法もあるかも知れませんので、探してみて下さい。