ข้ามไปที่เนื้อหา

ข้อกำหนดเบื้องต้น

ข้อควรระวัง

  • ข้อมูลต้องถูกปกปิดก่อนการส่งเพื่อให้แน่ใจว่าไม่มีข้อมูลส่วนบุคคลรวมอยู่ด้วย
  • ข้อมูลในตารางที่สำรองไว้จะถูกเก็บในรูปแบบเดิม
    • ในขณะที่สตรีม Fluentd และการส่งบันทึกของลูกค้า จะทำการวิเคราะห์ข้อมูลพื้นฐาน (เช่น IP) แต่โหมดการส่งบันทึกแบบแบตช์จะไม่ทำการวิเคราะห์ข้อมูล
  • ข้อมูลบันทึกต้องมีคอลัมน์ dateTime และ category
  • การส่งบันทึกแบบแบตช์ใช้สำหรับการอัปโหลดข้อมูลจำนวนมากในครั้งเดียว ดังนั้นไฟล์หลายไฟล์ที่แบ่งตามแถวควรถูกรวมเป็นไฟล์เดียวสำหรับการอัปโหลด และข้อมูลเรียลไทม์ควรส่งโดยใช้การส่งบันทึกของลูกค้าหรือการสตรีม Fluentd.

วิธีการกำหนดล็อก

การใช้หน้ากำหนดบันทึก

  • สคีมาบันทึกควรกำหนดไว้ล่วงหน้าผ่านการกำหนดบันทึก.
  • สำหรับข้อมูลรายละเอียดเกี่ยวกับการกำหนดบันทึก โปรดดูที่ กำหนดบันทึก.
    • ชื่อโต๊ะที่ตั้งไว้ในกำหนดบันทึกต้องตรงกับค่า category.
    • หากคุณไม่กำหนดบันทึกและดำเนินการส่งบันทึกแบบกลุ่ม ข้อมูลจะไม่ถูกเก็บไว้.
  • การส่งบันทึกแบบกลุ่มใช้ dateTime และ category เป็นคอลัมน์ที่จำเป็น หากไม่ถูกส่ง ข้อมูลจะไม่ถูกเก็บไว้.
  • ในระหว่างการกำหนดบันทึก อาจมีฟิลด์ที่สงวนไว้ซึ่งใช้ในวิเคราะห์รวมอยู่ด้วย.

คอลัมน์ที่จำเป็น

ไฟล์บันทึกของแบตช์มีสองคอลัมน์ที่สำคัญ

ชื่อคอลัมน์
ประเภทข้อมูล
คำอธิบาย
ตัวอย่าง
dateTime TIMESTAMP เวลาของการดึงข้อมูลหรือการอัปโหลดของแบตช์บันทึก
- ไม่รวมเขตเวลา (KST)
"YYYY-MM-DD hh:mm:ss"
category STRING รหัสหมวดหมู่ที่ตั้งค่าในสำนักงานรวบรวมบันทึก "account_table_snapshot"
  • หากคุณได้ใช้ "dateTime" เป็นชื่อคอลัมน์ในชุดบันทึก แนะนำให้เปลี่ยนเป็นชื่อคอลัมน์ที่แตกต่างก่อนการส่งข้อมูล
  • dateTime ถูกใช้เป็นข้อมูลสำหรับการแบ่งพาร์ติชัน ดังนั้นต้องเขียนเป็นเวลาของการส่งบันทึกไฟล์ชุดหรือเวลาของการอัปโหลด

การขออนุญาต

การขอสิทธิ์ BigQuery

  • สิทธิ์ในการเชื่อมต่อกับ BigQuery และสิทธิ์ในการ query ข้อมูลเพื่อดูข้อมูล
  • เมื่อสมัครขอสิทธิ์สำหรับ BigQuery สิทธิ์ในการอัปโหลด GCS จะได้รับการอนุญาตด้วย
  • คุณสามารถสมัครขอเข้าถึง BigQuery ผ่านเมนู Hive Console > Analytics > Log Definitions > Access BigQuery
  • สำหรับรายละเอียดเพิ่มเติม โปรดดูที่คู่มือการสมัครขอสิทธิ์ ตรวจสอบคู่มือการสมัครขอสิทธิ์