コンテンツにスキップ

前提条件

注意事項

  • データは、個人情報を含まないようにするために、送信前にマスクされなければなりません。
  • バックアップされたテーブルデータは、その元の形式で保存されます。
    • Fluentdとクライアントログの送信中は、データの基本的な解析(例えば、IPなど)を行いますが、ログバッチモードではデータ解析は行われません。
  • ログデータには、dateTimeおよびcategoryの列が必要です。
  • ログバッチ送信は、大量のデータを一度にアップロードするためのものです。したがって、行単位で分割された複数のファイルは、アップロードのために1つのファイルに結合する必要があり、リアルタイムデータはクライアントログ送信またはストリーミングFluentdを使用して送信する必要があります。

ログの定義方法

ログ定義ページの使用

  • ログスキーマは、事前にログ定義を通じて指定する必要があります。
  • ログ定義に関する詳細情報は、ログ定義を参照してください。
    • ログ定義で設定されたテーブル名は、category値と同じでなければなりません。
    • ログを定義せずにログバッチ送信を進めると、データは保存されません。
  • ログバッチは、dateTimecategoryを必須列として使用します。送信されない場合、データは保存されません。
  • ログ定義中に、分析で使用される予約フィールドが含まれる場合があります。

必須列

バッチファイルのログには2つの必須列があります。

列名
データ型
説明
サンプル
dateTime TIMESTAMP ログバッチの抽出またはアップロードの時間
- タイムゾーン(KST)は除外されます
"YYYY-MM-DD hh:mm:ss"
category STRING ログ収集バックオフィスで設定されたカテゴリID "account_table_snapshot"
  • ログバッチで"dateTime"を列名として使用している場合は、送信前に別の列名に変更することをお勧めします。
  • dateTimeはパーティショニングのデータとして使用されるため、バッチファイルのログ送信時刻またはアップロード時刻として記述する必要があります。

権限の申請

BigQueryの権限を申請する

  • BigQueryへの接続許可およびデータを表示するためのデータクエリ許可。
  • BigQueryの許可を申請する際には、GCSアップロードの許可も付与されます。
  • Hive コンソール > アナリティクス > ログ定義 > BigQueryにアクセス メニューを通じてBigQueryアクセスを申請できます。
  • 詳細については、許可申請ガイドを参照してください。許可申請ガイドを確認