Lewati ke konten

Ruang Metadata

Pengguna
Terakhir diperbarui 5 Juli 2026

Masuk untuk melihat Ruang Metadata

Panel personal menampilkan ringkasan milik Anda setelah login — data tidak dimuat di halaman publik.

Masuk

Apa & untuk apa

Ruang Metadata adalah pusat tata kelola data pribadi Anda di PSD. Di sini Anda mendokumentasikan aset data (dataset, output pipeline, dll.), mengukur kualitas data, memetakan lineage (asal-usul), dan menjalani kurikulum tata kelola yang terbukti dari aksi nyata.

Bayangkan Ruang Metadata sebagai kartu identitas setiap dataset: siapa pemiliknya, kolom apa saja isinya, seberapa lengkap dokumentasinya, apakah datanya memenuhi aturan kualitas, dan dari mana datanya berasal.

Setelah login, Ruang Kerja Metadata (/pustaka-metadata) menampilkan katalog pribadi Anda — daftar aset dengan skor kematangan, klasifikasi, dan skor kualitas terakhir.

Cara kerja

Ruang Metadata mengelola entri katalog per aset. Setiap entri berisi:

  • Metadata teknis — daftar kolom (nama, tipe, deskripsi).
  • Metadata bisnis — deskripsi, pemilik, tag, domain.
  • Klasifikasi — tingkat sensitivitas: public, internal, pii, rahasia.
  • Kualitas — profil kolom + aturan lulus/gagal + skor kondisi data.
  • Lineage — asal-usul data (upstream), terisi otomatis bila dari Pabrik Data.

Meter kematangan menghitung seberapa lengkap dokumentasi metadata (bukan kondisi data):

LevelSkorArti
**Dasar**0–49Baru ada metadata minimal.
**Berkembang**50–79Sebagian besar field sudah terisi.
**Matang**80–100Dokumentasi lengkap & siap dipublikasikan.

Field yang dinilai: deskripsi, kolom, deskripsi kolom, pemilik, tag, domain, klasifikasi, aturan kualitas, dan lineage.

Panen metadata otomatis: saat pipeline Pabrik Data (atau Studio Python) selesai di-run, PSD membuat entri katalog draft otomatis — berisi skema kolom, sinyal kualitas, dan lineage. Anda tinggal mengkurasi sebelum menerbitkan ke Pustaka Metadata.

Kapan dipakai

Cocok untuk:

  • Mendokumentasikan dataset agar orang lain (atau Anda sendiri di masa depan) memahami isinya.
  • Mengukur dan memantau kualitas data sebelum dipakai analitik atau model ML.
  • Belajar tata kelola data dengan kurikulum 6 tahap yang terbukti dari praktik nyata.
  • Menyiapkan metadata sebelum menerbitkan koleksi ke Pustaka Metadata.
  • Melacak asal-usul data dari pipeline Pabrik Data.

Kurang tepat bila:

  • Anda hanya butuh visualisasi cepat — gunakan Ruang Analitik.
  • Data belum ada sama sekali — buat dulu di Dataset, Pabrik Data, atau Data Sintesis.

Langkah demi langkah

Membuka katalog pribadi

  1. Buka Suite Data → Ruang Metadata (/pustaka-metadata).
  2. Masuk bila belum login — katalog pribadi hanya tampil setelah autentikasi.
  3. Lihat daftar aset dengan badge kematangan, klasifikasi, dan skor kualitas.
  4. Filter berdasarkan domain, klasifikasi, sumber (pipeline/manual), atau status (draft/terbit).

Mengelola metadata aset

  1. Dari halaman dataset atau output Pabrik Data, klik Kelola metadata — atau buka entri dari katalog.
  2. Tab Metadata:
  • Isi deskripsi, pemilik, tag, dan domain.
  • Tambah/edit kolom (nama, tipe, deskripsi per kolom).
  • Pilih klasifikasi: public, internal, pii, atau rahasia.
  1. Perhatikan meter kematangan — daftar "Belum ada: …" memandu field yang masih kosong.
  2. Klik Simpan — skor kematangan diperbarui otomatis.

Mengukur kualitas data

  1. Buka tab Kualitas pada entri aset.
  2. Klik Profil kolom — sistem menganalisis total baris, null, distinct, dan metrik lain per kolom.
  3. Susun aturan kualitas per kolom:
AturanFungsi
`not_null`Kolom wajib terisi (threshold kelengkapan).
`unique`Nilai harus unik (threshold keunikan).
`allowed_values`Nilai harus dalam domain yang diizinkan.
`freshness`Data tidak boleh lebih tua dari X jam.
  1. Klik Jalankan — lihat skor kualitas (0–100) dan status lulus/gagal per aturan.
  2. Perbaiki data di pipeline jika aturan gagal, lalu jalankan ulang pemeriksaan.
Kematangan ≠ kualitas. Kematangan = kelengkapan dokumentasi. Kualitas = kondisi data aktual. Keduanya ditampilkan terpisah.

Melihat lineage

  1. Buka tab Lineage pada entri aset.
  2. Lihat diagram upstream → aset ini.
  3. Bila data berasal dari Pabrik Data, lineage terisi otomatis — tidak perlu input manual.

Mengikuti kurikulum tata kelola

  1. Buka tab Perjalanan pada entri aset.
  2. Lihat 6 tahap kurikulum:
TahapTerbukti bila…
**Metadata Dasar**Ada deskripsi & daftar kolom.
**Skema & Label**Tiap kolom punya deskripsi + tag.
**Kualitas Data**Aturan kualitas ada & skor ≥ 80.
**Tata Kelola**Pemilik, domain, & klasifikasi terisi.
**Lineage**Asal-usul data terpetakan.
**Metadata Big Data**Metadata partisi, kontrak data, & SLA terisi.
  1. Setiap tahap terbukti dari aksi nyata → Anda mendapat poin/quest.

Mengkurasi draft dari pipeline

  1. Setelah pipeline di-run, entri draft muncul otomatis di katalog (badge "Dari pipeline").
  2. Banner "Entri baru dari pipeline" muncul bila ada draft yang menunggu kurasi.
  3. Tinjau klasifikasi — terutama bila ada indikasi PII.
  4. Lengkapi metadata yang masih kosong.
  5. Tambahkan ke Pustaka Metadata bila siap diterbitkan ke komunitas.

Batas tier

Tier membatasi jumlah entri katalog, frekuensi profil kolom, dan pemeriksaan kualitas. Angka berikut ilustratif — angka dapat berubah.

TierEntri katalogProfil kolom / bulanPemeriksaan kualitas / bulan
Dasar1055
Menengah302020
Lanjut1005050
Pakar500200200
Angka dapat berubah. Profil kolom pada data besar memakai sampling — hasil tetap representatif tanpa memindai seluruh dataset.

Poin & quest

AktivitasPoin (ilustratif)
Entri metadata pertama+10
Kematangan ≥ 80 (Metadata Matang)+15
Skor kualitas ≥ 90 (Penjaga Kualitas)+15
Tahap kurikulum terbukti+5 per tahap

Quest bertema Ruang Metadata:

  1. Kartu Identitas — buat entri metadata pertama untuk satu aset.
  2. Metadata Matang — capai kematangan ≥ 80 pada satu aset.
  3. Penjaga Kualitas — capai skor kualitas ≥ 90.
  4. Jejak Asal — entri dengan lineage terisi otomatis dari pipeline.
  5. Kurasi Pipeline — kurasi draft hasil panen pipeline menjadi metadata lengkap.

Masalah umum & solusi

Pesan / gejalaSolusi
**Belum ada aset terkatalog**Buka halaman dataset → **Kelola metadata**, atau jalankan pipeline Pabrik Data hingga menghasilkan output gold.
**Skor kematangan rendah**Lihat daftar "Belum ada" di meter kematangan — isi field yang masih kosong (deskripsi, pemilik, klasifikasi, dll.).
**Skor kualitas rendah**Jalankan **Profil kolom** dulu, lalu periksa aturan yang gagal. Perbaiki data di pipeline dan run ulang.
**Lineage kosong**Lineage terisi otomatis dari Pabrik Data. Generate dataset lewat pipeline, bukan upload manual tanpa jejak.
**Entri draft menumpuk**Filter sumber **Dari pipeline** + status **Draft**. Kurasi satu per satu atau buat Pustaka dari pilihan.
**Badge "Sumber dihapus"**Aset sumber sudah dihapus atau masuk sampah — metadata tetap tampil dengan status benar, bukan error.
**Klasifikasi PII/rahasia**Waspada sebelum publikasi — data sensitif dibatasi tampil di pencarian publik dan diblokir dari Pustaka bila berisiko.
**Profil kolom lambat**Normal untuk data besar — sistem memakai sampling. Coba lagi atau naikkan tier.

Fitur terkait

  • Dataset — aset utama yang didokumentasikan di katalog metadata.
  • Pabrik Data — sumber lineage otomatis dan panen metadata draft dari run pipeline.
  • Pustaka Metadata — publikasikan koleksi metadata terkurasi ke komunitas (dengan guard PII).
  • Ruang Analitik — visualisasi data setelah metadata & kualitas memadai.
  • Data Sintesis — dataset sintesis juga bisa didokumentasikan; pastikan label "Data Sintesis" jelas.
  • Studio Python — output script yang di-promote ke pipeline juga memicu panen metadata otomatis.