Ruang Metadata

Pengguna

Terakhir diperbarui 5 Juli 2026

Masuk untuk melihat Ruang Metadata

Panel personal menampilkan ringkasan milik Anda setelah login — data tidak dimuat di halaman publik.

Apa & untuk apa

Ruang Metadata adalah pusat tata kelola data pribadi Anda di PSD. Di sini Anda mendokumentasikan aset data (dataset, output pipeline, dll.), mengukur kualitas data, memetakan lineage (asal-usul), dan menjalani kurikulum tata kelola yang terbukti dari aksi nyata.

Bayangkan Ruang Metadata sebagai kartu identitas setiap dataset: siapa pemiliknya, kolom apa saja isinya, seberapa lengkap dokumentasinya, apakah datanya memenuhi aturan kualitas, dan dari mana datanya berasal.

Setelah login, Ruang Kerja Metadata (/pustaka-metadata) menampilkan katalog pribadi Anda — daftar aset dengan skor kematangan, klasifikasi, dan skor kualitas terakhir.

Cara kerja

Ruang Metadata mengelola entri katalog per aset. Setiap entri berisi:

Metadata teknis — daftar kolom (nama, tipe, deskripsi).
Metadata bisnis — deskripsi, pemilik, tag, domain.
Klasifikasi — tingkat sensitivitas: public, internal, pii, rahasia.
Kualitas — profil kolom + aturan lulus/gagal + skor kondisi data.
Lineage — asal-usul data (upstream), terisi otomatis bila dari Pabrik Data.

Meter kematangan menghitung seberapa lengkap dokumentasi metadata (bukan kondisi data):

Level	Skor	Arti
Dasar	0–49	Baru ada metadata minimal.
Berkembang	50–79	Sebagian besar field sudah terisi.
Matang	80–100	Dokumentasi lengkap & siap dipublikasikan.

Field yang dinilai: deskripsi, kolom, deskripsi kolom, pemilik, tag, domain, klasifikasi, aturan kualitas, dan lineage.

Panen metadata otomatis: saat pipeline Pabrik Data (atau Studio Python) selesai di-run, PSD membuat entri katalog draft otomatis — berisi skema kolom, sinyal kualitas, dan lineage. Anda tinggal mengkurasi sebelum menerbitkan ke Pustaka Metadata.

Kapan dipakai

Cocok untuk:

Mendokumentasikan dataset agar orang lain (atau Anda sendiri di masa depan) memahami isinya.
Mengukur dan memantau kualitas data sebelum dipakai analitik atau model ML.
Belajar tata kelola data dengan kurikulum 6 tahap yang terbukti dari praktik nyata.
Menyiapkan metadata sebelum menerbitkan koleksi ke Pustaka Metadata.
Melacak asal-usul data dari pipeline Pabrik Data.

Kurang tepat bila:

Anda hanya butuh visualisasi cepat — gunakan Ruang Analitik.
Data belum ada sama sekali — buat dulu di Dataset, Pabrik Data, atau Data Sintesis.

Langkah demi langkah

Membuka katalog pribadi

Buka Suite Data → Ruang Metadata (/pustaka-metadata).
Masuk bila belum login — katalog pribadi hanya tampil setelah autentikasi.
Lihat daftar aset dengan badge kematangan, klasifikasi, dan skor kualitas.
Filter berdasarkan domain, klasifikasi, sumber (pipeline/manual), atau status (draft/terbit).

Mengelola metadata aset

Dari halaman dataset atau output Pabrik Data, klik Kelola metadata — atau buka entri dari katalog.
Tab Metadata:

Isi deskripsi, pemilik, tag, dan domain.
Tambah/edit kolom (nama, tipe, deskripsi per kolom).
Pilih klasifikasi: public, internal, pii, atau rahasia.

Perhatikan meter kematangan — daftar "Belum ada: …" memandu field yang masih kosong.
Klik Simpan — skor kematangan diperbarui otomatis.

Mengukur kualitas data

Buka tab Kualitas pada entri aset.
Klik Profil kolom — sistem menganalisis total baris, null, distinct, dan metrik lain per kolom.
Susun aturan kualitas per kolom:

Aturan	Fungsi
`not_null`	Kolom wajib terisi (threshold kelengkapan).
`unique`	Nilai harus unik (threshold keunikan).
`allowed_values`	Nilai harus dalam domain yang diizinkan.
`freshness`	Data tidak boleh lebih tua dari X jam.

Klik Jalankan — lihat skor kualitas (0–100) dan status lulus/gagal per aturan.
Perbaiki data di pipeline jika aturan gagal, lalu jalankan ulang pemeriksaan.

Kematangan ≠ kualitas. Kematangan = kelengkapan dokumentasi. Kualitas = kondisi data aktual. Keduanya ditampilkan terpisah.

Melihat lineage

Buka tab Lineage pada entri aset.
Lihat diagram upstream → aset ini.
Bila data berasal dari Pabrik Data, lineage terisi otomatis — tidak perlu input manual.

Mengikuti kurikulum tata kelola

Buka tab Perjalanan pada entri aset.
Lihat 6 tahap kurikulum:

Tahap	Terbukti bila…
Metadata Dasar	Ada deskripsi & daftar kolom.
Skema & Label	Tiap kolom punya deskripsi + tag.
Kualitas Data	Aturan kualitas ada & skor ≥ 80.
Tata Kelola	Pemilik, domain, & klasifikasi terisi.
Lineage	Asal-usul data terpetakan.
Metadata Big Data	Metadata partisi, kontrak data, & SLA terisi.

Setiap tahap terbukti dari aksi nyata → Anda mendapat poin/quest.

Mengkurasi draft dari pipeline

Setelah pipeline di-run, entri draft muncul otomatis di katalog (badge "Dari pipeline").
Banner "Entri baru dari pipeline" muncul bila ada draft yang menunggu kurasi.
Tinjau klasifikasi — terutama bila ada indikasi PII.
Lengkapi metadata yang masih kosong.
Tambahkan ke Pustaka Metadata bila siap diterbitkan ke komunitas.

Batas tier

Tier membatasi jumlah entri katalog, frekuensi profil kolom, dan pemeriksaan kualitas. Angka berikut ilustratif — angka dapat berubah.

Tier	Entri katalog	Profil kolom / bulan	Pemeriksaan kualitas / bulan
Dasar	10	5	5
Menengah	30	20	20
Lanjut	100	50	50
Pakar	500	200	200

Angka dapat berubah. Profil kolom pada data besar memakai sampling — hasil tetap representatif tanpa memindai seluruh dataset.

Poin & quest

Aktivitas	Poin (ilustratif)
Entri metadata pertama	+10
Kematangan ≥ 80 (Metadata Matang)	+15
Skor kualitas ≥ 90 (Penjaga Kualitas)	+15
Tahap kurikulum terbukti	+5 per tahap

Quest bertema Ruang Metadata:

Kartu Identitas — buat entri metadata pertama untuk satu aset.
Metadata Matang — capai kematangan ≥ 80 pada satu aset.
Penjaga Kualitas — capai skor kualitas ≥ 90.
Jejak Asal — entri dengan lineage terisi otomatis dari pipeline.
Kurasi Pipeline — kurasi draft hasil panen pipeline menjadi metadata lengkap.

Masalah umum & solusi

Pesan / gejala	Solusi
Belum ada aset terkatalog	Buka halaman dataset → Kelola metadata, atau jalankan pipeline Pabrik Data hingga menghasilkan output gold.
Skor kematangan rendah	Lihat daftar "Belum ada" di meter kematangan — isi field yang masih kosong (deskripsi, pemilik, klasifikasi, dll.).
Skor kualitas rendah	Jalankan Profil kolom dulu, lalu periksa aturan yang gagal. Perbaiki data di pipeline dan run ulang.
Lineage kosong	Lineage terisi otomatis dari Pabrik Data. Generate dataset lewat pipeline, bukan upload manual tanpa jejak.
Entri draft menumpuk	Filter sumber Dari pipeline + status Draft. Kurasi satu per satu atau buat Pustaka dari pilihan.
Badge "Sumber dihapus"	Aset sumber sudah dihapus atau masuk sampah — metadata tetap tampil dengan status benar, bukan error.
Klasifikasi PII/rahasia	Waspada sebelum publikasi — data sensitif dibatasi tampil di pencarian publik dan diblokir dari Pustaka bila berisiko.
Profil kolom lambat	Normal untuk data besar — sistem memakai sampling. Coba lagi atau naikkan tier.

Fitur terkait

Dataset — aset utama yang didokumentasikan di katalog metadata.
Pabrik Data — sumber lineage otomatis dan panen metadata draft dari run pipeline.
Pustaka Metadata — publikasikan koleksi metadata terkurasi ke komunitas (dengan guard PII).
Ruang Analitik — visualisasi data setelah metadata & kualitas memadai.
Data Sintesis — dataset sintesis juga bisa didokumentasikan; pastikan label "Data Sintesis" jelas.
Studio Python — output script yang di-promote ke pipeline juga memicu panen metadata otomatis.

Pesan / gejala	Solusi
Belum ada aset terkatalog	Buka halaman dataset → Kelola metadata, atau jalankan pipeline Pabrik Data hingga menghasilkan output gold.
Skor kematangan rendah	Lihat daftar "Belum ada" di meter kematangan — isi field yang masih kosong (deskripsi, pemilik, klasifikasi, dll.).
Skor kualitas rendah	Jalankan Profil kolom dulu, lalu periksa aturan yang gagal. Perbaiki data di pipeline dan run ulang.
Lineage kosong	Lineage terisi otomatis dari Pabrik Data. Generate dataset lewat pipeline, bukan upload manual tanpa jejak.
Entri draft menumpuk	Filter sumber Dari pipeline + status Draft. Kurasi satu per satu atau buat Pustaka dari pilihan.
Badge "Sumber dihapus"	Aset sumber sudah dihapus atau masuk sampah — metadata tetap tampil dengan status benar, bukan error.
Klasifikasi PII/rahasia	Waspada sebelum publikasi — data sensitif dibatasi tampil di pencarian publik dan diblokir dari Pustaka bila berisiko.
Profil kolom lambat	Normal untuk data besar — sistem memakai sampling. Coba lagi atau naikkan tier.