Lewati ke konten
Katalog data terbuka

Dataset

Jelajahi data NLP, citra, tabular, dan survei UMKM dari komunitas PSD — unduh untuk EDA, latih model, atau ikut kompetisi.

Masuk untuk publikasi

Apa peran dataset di PSD?

  • Katalog dataset PSD adalah repositori data terbuka — dari survei UMKM, citra pertanian, hingga korpus bahasa daerah, siap untuk EDA dan pelatihan model.
  • Dataset sintesis dari Ruang Ide ditandai khusus — aman untuk latihan kompetisi tanpa data sensitif asli.
  • Dataset menjadi fondasi alur eksplorasi → model → kompetisi — terhubung ke notebook, sintesis, dan leaderboard.

Alur dataset di ekosistem PSD

Dari menemukan data hingga berkontribusi — setiap langkah membangun skill berbeda.

Temukan

Jelajahi katalog terbuka

Eksplorasi

Unduh & EDA di notebook

Latih model

Baseline ke kompetisi

Kontribusi

Publikasikan dataset Anda

Kapan pakai dataset dari katalog?

  • Butuh data real untuk latihan NLP, CV, atau tabular pada domain Indonesia.
  • Ingin baseline kompetisi — unduh, eksplorasi di notebook, lalu submit model.
  • Perlu data sintesis aman dari Ruang Ide untuk eksperimen tanpa PII.

Punya dataset worth sharing?

Masuk dan publikasikan data terbuka — bantu praktisi lain mulai eksplorasi lebih cepat.

Publikasikan dataset pertama