前提条件
注意事項¶
- データは、個人情報を含まないようにするために、送信前にマスクされなければなりません。
- バックアップされたテーブルデータは、その元の形式で保存されます。
- Fluentdとクライアントログの送信中は、データの基本的な解析(例えば、IPなど)を行いますが、ログバッチモードではデータ解析は行われません。
- ログデータには、dateTimeおよびcategoryの列が必要です。
- ログバッチ送信は、大量のデータを一度にアップロードするためのものです。したがって、行単位で分割された複数のファイルは、アップロードのために1つのファイルに結合する必要があり、リアルタイムデータはクライアントログ送信またはストリーミングFluentdを使用して送信する必要があります。
ログの定義方法¶
ログ定義ページの使用¶
- ログスキーマは、事前にログ定義を通じて指定する必要があります。
- ログ定義に関する詳細情報は、ログ定義を参照してください。
- ログ定義で設定されたテーブル名は、category値と同じでなければなりません。
- ログを定義せずにログバッチ送信を進めると、データは保存されません。
- ログバッチは、dateTimeとcategoryを必須列として使用します。送信されない場合、データは保存されません。
- ログ定義中に、分析で使用される予約フィールドが含まれる場合があります。
必須列¶
バッチファイルのログには2つの必須列があります。
列名 | データ型 | 説明 | サンプル |
---|---|---|---|
dateTime | TIMESTAMP | ログバッチの抽出またはアップロードの時間 - タイムゾーン(KST)は除外されます | "YYYY-MM-DD hh:mm:ss" |
category | STRING | ログ収集バックオフィスで設定されたカテゴリID | "account_table_snapshot" |
- ログバッチで"dateTime"を列名として使用している場合は、送信前に別の列名に変更することをお勧めします。
- dateTimeはパーティショニングのデータとして使用されるため、バッチファイルのログ送信時刻またはアップロード時刻として記述する必要があります。
権限の申請¶
BigQueryの権限を申請する¶
- BigQueryへの接続許可およびデータを表示するためのデータクエリ許可。
- BigQueryの許可を申請する際には、GCSアップロードの許可も付与されます。
- Hive コンソール > アナリティクス > ログ定義 > BigQueryにアクセス メニューを通じてBigQueryアクセスを申請できます。
- 詳細については、許可申請ガイドを参照してください。許可申請ガイドを確認