Ruang Metadata
Masuk untuk melihat Ruang Metadata
Panel personal menampilkan ringkasan milik Anda setelah login — data tidak dimuat di halaman publik.
MasukApa & untuk apa
Ruang Metadata adalah pusat tata kelola data pribadi Anda di PSD. Di sini Anda mendokumentasikan aset data (dataset, output pipeline, dll.), mengukur kualitas data, memetakan lineage (asal-usul), dan menjalani kurikulum tata kelola yang terbukti dari aksi nyata.
Bayangkan Ruang Metadata sebagai kartu identitas setiap dataset: siapa pemiliknya, kolom apa saja isinya, seberapa lengkap dokumentasinya, apakah datanya memenuhi aturan kualitas, dan dari mana datanya berasal.
/pustaka-metadata) menampilkan katalog pribadi Anda — daftar aset dengan skor kematangan, klasifikasi, dan skor kualitas terakhir.Cara kerja
Ruang Metadata mengelola entri katalog per aset. Setiap entri berisi:
- Metadata teknis — daftar kolom (nama, tipe, deskripsi).
- Metadata bisnis — deskripsi, pemilik, tag, domain.
- Klasifikasi — tingkat sensitivitas:
public,internal,pii,rahasia. - Kualitas — profil kolom + aturan lulus/gagal + skor kondisi data.
- Lineage — asal-usul data (upstream), terisi otomatis bila dari Pabrik Data.
Meter kematangan menghitung seberapa lengkap dokumentasi metadata (bukan kondisi data):
| Level | Skor | Arti |
|---|---|---|
| **Dasar** | 0–49 | Baru ada metadata minimal. |
| **Berkembang** | 50–79 | Sebagian besar field sudah terisi. |
| **Matang** | 80–100 | Dokumentasi lengkap & siap dipublikasikan. |
Field yang dinilai: deskripsi, kolom, deskripsi kolom, pemilik, tag, domain, klasifikasi, aturan kualitas, dan lineage.
Panen metadata otomatis: saat pipeline Pabrik Data (atau Studio Python) selesai di-run, PSD membuat entri katalog draft otomatis — berisi skema kolom, sinyal kualitas, dan lineage. Anda tinggal mengkurasi sebelum menerbitkan ke Pustaka Metadata.
Kapan dipakai
Cocok untuk:
- Mendokumentasikan dataset agar orang lain (atau Anda sendiri di masa depan) memahami isinya.
- Mengukur dan memantau kualitas data sebelum dipakai analitik atau model ML.
- Belajar tata kelola data dengan kurikulum 6 tahap yang terbukti dari praktik nyata.
- Menyiapkan metadata sebelum menerbitkan koleksi ke Pustaka Metadata.
- Melacak asal-usul data dari pipeline Pabrik Data.
Kurang tepat bila:
- Anda hanya butuh visualisasi cepat — gunakan Ruang Analitik.
- Data belum ada sama sekali — buat dulu di Dataset, Pabrik Data, atau Data Sintesis.
Langkah demi langkah
Membuka katalog pribadi
- Buka Suite Data → Ruang Metadata (
/pustaka-metadata). - Masuk bila belum login — katalog pribadi hanya tampil setelah autentikasi.
- Lihat daftar aset dengan badge kematangan, klasifikasi, dan skor kualitas.
- Filter berdasarkan domain, klasifikasi, sumber (pipeline/manual), atau status (draft/terbit).
Mengelola metadata aset
- Dari halaman dataset atau output Pabrik Data, klik Kelola metadata — atau buka entri dari katalog.
- Tab Metadata:
- Isi deskripsi, pemilik, tag, dan domain.
- Tambah/edit kolom (nama, tipe, deskripsi per kolom).
- Pilih klasifikasi: public, internal, pii, atau rahasia.
- Perhatikan meter kematangan — daftar "Belum ada: …" memandu field yang masih kosong.
- Klik Simpan — skor kematangan diperbarui otomatis.
Mengukur kualitas data
- Buka tab Kualitas pada entri aset.
- Klik Profil kolom — sistem menganalisis total baris, null, distinct, dan metrik lain per kolom.
- Susun aturan kualitas per kolom:
| Aturan | Fungsi |
|---|---|
| `not_null` | Kolom wajib terisi (threshold kelengkapan). |
| `unique` | Nilai harus unik (threshold keunikan). |
| `allowed_values` | Nilai harus dalam domain yang diizinkan. |
| `freshness` | Data tidak boleh lebih tua dari X jam. |
- Klik Jalankan — lihat skor kualitas (0–100) dan status lulus/gagal per aturan.
- Perbaiki data di pipeline jika aturan gagal, lalu jalankan ulang pemeriksaan.
Melihat lineage
- Buka tab Lineage pada entri aset.
- Lihat diagram upstream → aset ini.
- Bila data berasal dari Pabrik Data, lineage terisi otomatis — tidak perlu input manual.
Mengikuti kurikulum tata kelola
- Buka tab Perjalanan pada entri aset.
- Lihat 6 tahap kurikulum:
| Tahap | Terbukti bila… |
|---|---|
| **Metadata Dasar** | Ada deskripsi & daftar kolom. |
| **Skema & Label** | Tiap kolom punya deskripsi + tag. |
| **Kualitas Data** | Aturan kualitas ada & skor ≥ 80. |
| **Tata Kelola** | Pemilik, domain, & klasifikasi terisi. |
| **Lineage** | Asal-usul data terpetakan. |
| **Metadata Big Data** | Metadata partisi, kontrak data, & SLA terisi. |
- Setiap tahap terbukti dari aksi nyata → Anda mendapat poin/quest.
Mengkurasi draft dari pipeline
- Setelah pipeline di-run, entri draft muncul otomatis di katalog (badge "Dari pipeline").
- Banner "Entri baru dari pipeline" muncul bila ada draft yang menunggu kurasi.
- Tinjau klasifikasi — terutama bila ada indikasi PII.
- Lengkapi metadata yang masih kosong.
- Tambahkan ke Pustaka Metadata bila siap diterbitkan ke komunitas.
Batas tier
Tier membatasi jumlah entri katalog, frekuensi profil kolom, dan pemeriksaan kualitas. Angka berikut ilustratif — angka dapat berubah.
| Tier | Entri katalog | Profil kolom / bulan | Pemeriksaan kualitas / bulan |
|---|---|---|---|
| Dasar | 10 | 5 | 5 |
| Menengah | 30 | 20 | 20 |
| Lanjut | 100 | 50 | 50 |
| Pakar | 500 | 200 | 200 |
Poin & quest
| Aktivitas | Poin (ilustratif) |
|---|---|
| Entri metadata pertama | +10 |
| Kematangan ≥ 80 (Metadata Matang) | +15 |
| Skor kualitas ≥ 90 (Penjaga Kualitas) | +15 |
| Tahap kurikulum terbukti | +5 per tahap |
Quest bertema Ruang Metadata:
- Kartu Identitas — buat entri metadata pertama untuk satu aset.
- Metadata Matang — capai kematangan ≥ 80 pada satu aset.
- Penjaga Kualitas — capai skor kualitas ≥ 90.
- Jejak Asal — entri dengan lineage terisi otomatis dari pipeline.
- Kurasi Pipeline — kurasi draft hasil panen pipeline menjadi metadata lengkap.
Masalah umum & solusi
| Pesan / gejala | Solusi |
|---|---|
| **Belum ada aset terkatalog** | Buka halaman dataset → **Kelola metadata**, atau jalankan pipeline Pabrik Data hingga menghasilkan output gold. |
| **Skor kematangan rendah** | Lihat daftar "Belum ada" di meter kematangan — isi field yang masih kosong (deskripsi, pemilik, klasifikasi, dll.). |
| **Skor kualitas rendah** | Jalankan **Profil kolom** dulu, lalu periksa aturan yang gagal. Perbaiki data di pipeline dan run ulang. |
| **Lineage kosong** | Lineage terisi otomatis dari Pabrik Data. Generate dataset lewat pipeline, bukan upload manual tanpa jejak. |
| **Entri draft menumpuk** | Filter sumber **Dari pipeline** + status **Draft**. Kurasi satu per satu atau buat Pustaka dari pilihan. |
| **Badge "Sumber dihapus"** | Aset sumber sudah dihapus atau masuk sampah — metadata tetap tampil dengan status benar, bukan error. |
| **Klasifikasi PII/rahasia** | Waspada sebelum publikasi — data sensitif dibatasi tampil di pencarian publik dan diblokir dari Pustaka bila berisiko. |
| **Profil kolom lambat** | Normal untuk data besar — sistem memakai sampling. Coba lagi atau naikkan tier. |
Fitur terkait
- Dataset — aset utama yang didokumentasikan di katalog metadata.
- Pabrik Data — sumber lineage otomatis dan panen metadata draft dari run pipeline.
- Pustaka Metadata — publikasikan koleksi metadata terkurasi ke komunitas (dengan guard PII).
- Ruang Analitik — visualisasi data setelah metadata & kualitas memadai.
- Data Sintesis — dataset sintesis juga bisa didokumentasikan; pastikan label "Data Sintesis" jelas.
- Studio Python — output script yang di-promote ke pipeline juga memicu panen metadata otomatis.