ローデータと生データとは?データ解析の基本概念をわかりやすく解説

Explanation of IT Terms

ローデータと生データとは?データ解析の基本概念をわかりやすく解説

ローデータとは?

ローデータとは、そのままでは分析が困難な形式のデータのことを指します。例えば、カンマ区切りのCSVファイルや、Excelファイルのような形式で保存されたデータがローデータに当たります。

ローデータは、まだ整理されていない生のデータであり、まだ利用価値が低いため、データ解析の前に前処理が必要です。前処理には、欠損値の補完や異常値の除去、不要なデータの削除などが含まれます。

生データとは?

生データとは、観測や計測から得られた、そのままの形式で保存されたデータのことを指します。例えば、気象観測のデータや、センサーから取得したデータが生データに当たります。

生データは、そのままでは分析が困難であり、前処理が必要となります。また、生データを取得する前に適切なセンサーを選定し、適切なパラメーターを設定する必要があります。

まとめ

ローデータと生データは、どちらもデータ解析に必要な情報を持っているが、そのままでは分析が困難であるため、前処理が必要となることが多いです。データ解析を行う際には、適切な前処理を施してから分析を行い、データから有用な情報を抽出することが重要です。

参考記事

参考サイト

合わせて読みたい

【Google Chrome】右クリックで翻訳がでなくなった時の対策方法の決定版