PDFの表をhtmlテーブルタグに変換する方法(Word・Excel・WEBツール)

PDFの表をhtmlテーブルタグに変換する方法(Word・Excel・WEBツール)

PDFの表をhtmlテーブルタグに変換する方法(Word・Excel・WEBツール)

PDF形式でもらった表データをhtmlのtableタグソースに変換する方法をご紹介します。

一旦Wordに変換し、Excelのセルにコピペ、WEBツールでhtmlソースに変換する流れです。

PDFはアウトラインのものでも変換される事が多く、大変便利です。

PDFの表をhtmlのtableデータに変換する方法

PDFになっている様々な表データをWEBページに掲載する事ってよくありますよね。

表はそのまま画像として載せるより、htmlソースに直接tableデータとして表示するべきでしょう。

この時PDFの数値を一つ一つ、直接tableタグ内に入力していくのは結構手間が掛かります。

本記事で紹介する方法を使えば、tableタグのソースになった状態でコピペしてくる事ができるので、後はタグを整理するだけです。

手順も非常に簡単ですのでご紹介していきますね。

PDFをそのままWord形式で開く

変換したい表データの入ったPDFを、まずはWord形式で開きましょう。

右クリックメニューから、「プログラムから開く」→「別のプログラムから選択」→「Word」

別のプログラムから選択

最初に表示されている一覧の中にWordがなくても、空白部分をクリックするとソフトがさらに表示されます。

ファイルを開くソフト一覧

もしくはWordファイルを新規作成して、そこから対象のPDFファイルを開く形でも大丈夫です。

Wordによる変換

下の様なガイダンスが表示されますので、OKを押しましょう。

編集可能なWordファイルに変換

PDFの内容によっては処理に時間が掛かる場合がありますので、「OK」が押せるようになるまで待ちましょう。

OKが押せたら、開いた内容を確認しましょう。

ポイント:アウトライン化PDFについて

PDFにはアウトライン化されてないものとアウトライン化されたものとあります。

アウトライン化されている場合、PDF上のテキストや表データはドラッグで選択する事ができませんよね。

一見難しそうですが、この状態でもWordファイルで開く際に変換される場合が多いです。素晴らしい事です。

ただし完璧にトレースできていない場合もありますので、データが変換されているどうかは確認する必要があります。

表データ部分をExcelに張り付ける

tableタグソースにしたい表データ部分を探します。

データの左上端にある+マークを選択して、右クリック「コピー」をしましょう。

表データ左上の+マークからコピー

次にExcelファイルを新規で開き、右クリック「貼り付け」をしてペーストしてきます。

変換予定の表データが表示されました。

Excelに表データを貼り付け

PDFを直接Excelで開くことはできない

ここまでPDF→Word→Excelという工程を進んでいますが、PDFを直接Excelで開くことはできません。

ですので一旦Wordファイルに変換したものをExcelに張り付けています。

Excelに変換する事で次に紹介する変換ツールが利用できるようになります。

Excelのデータをtableタグに変換してくれるWEBツール

Excelのデータをtableタグに変換してくれるWEBツールです、下記URLを開きましょう。

ExcelからHTMLテーブルタグ変換

ExcelからHTMLテーブルタグ変換:https://ao-system.net/exceltable/

表データのセルを範囲選択・コピペ

先ほどのExcelの表データセル部分を全部選択して「コピー」します。

表データセルをコピー

WEBツール上の黄色いマスの中で「貼り付け」すると、データが表示されます。

貼り付け

このまま下にスクロールすると、広告欄の下部分に「結果のプレビュー」の欄がありますので、そこで状態を確認しましょう。

結果のプレビュー

表内のセル内容は修正できる

上の黄色のマス内で、元データの数値変更ができます。

ですのでExcel上で変更してコピペし直さなくても大丈夫です。

htmlテーブルソースの表示

「結果のプレビュー」のさらに下に、「結果のHTMLコード」の欄があります。

ここにtableソースに変換された情報が表示されています。

htmlテーブルソース

このtableソースをコピペして、htmlタグ上に張り付ければ完了です。

ツールオプション

htmlソースに変換する際、様々なオプションが用意されています。

オプションを選択すると、ソースが加工されます。

ソースオプション

インデント

・改行をしない
・インデントなし
・スペース1個
・スペース2個
・スペース4個
・タブ

改行をしない

改行やスペースが一切入らない羅列された状態になります。
いわゆるminファイルの様な感じですね。

インデントなし

改行後のスペースが一切入らない状態になります。全て左端に寄った状態です。

スペース1個~4個

各タグ前のスペースの入り方を調整できます。

タブ

各タグ前にタブが一つずつ入った状態になります。

タグの改行

・trとtdを同一行
・trとtdは別行

trとtdを同一行

trとtdの間に改行が入らず、連続した記述になります。

trとtdは別行

trとtdの間が一段改行されます。

テーブル表現

・tabke tr td
・div dl dd
・div ul li

さらにtableタグ以外に「div dl dd」形式「div ul li」形式でも出力できます。

まとめ

以上PDFデータをtableタグへ変換する方法をご紹介しました。

大変便利ですし時間も掛かりませんね。何よりアウトライン化されたPDFでもtableデータにできるのは大きいです。

データを表タグに変換するのは大変です

基本的にクライアントから提供いただく素材は、データ(コピペ可能なもの)でもらうのが普通です。

しかしテキストと違って、表データだけはhtmlのテーブルタグに整形しなければなりません。

今回の様にWordやExcel・PDFの表データを、即tableタグに変換できれば時間短縮につながります。

今回は一つの方法であり、変換方法は他にもたくさんあると思います。

もっと工程をショートカットできる方法もあるかも知れませんので、探してみて下さい。

この記事をシェアする

一押し人気コーナー紹介

その他フリージャンル記事