Katalog data terbuka
Dataset
Jelajahi data NLP, citra, tabular, dan survei UMKM dari komunitas PSD — unduh untuk EDA, latih model, atau ikut kompetisi.
Apa peran dataset di PSD?
- Katalog dataset PSD adalah repositori data terbuka — dari survei UMKM, citra pertanian, hingga korpus bahasa daerah, siap untuk EDA dan pelatihan model.
- Dataset sintesis dari Ruang Ide ditandai khusus — aman untuk latihan kompetisi tanpa data sensitif asli.
- Dataset menjadi fondasi alur eksplorasi → model → kompetisi — terhubung ke notebook, sintesis, dan leaderboard.
Alur dataset di ekosistem PSD
Dari menemukan data hingga berkontribusi — setiap langkah membangun skill berbeda.
Temukan
Jelajahi katalog terbuka
Eksplorasi
Unduh & EDA di notebook
Latih model
Baseline ke kompetisi
Kontribusi
Publikasikan dataset Anda
Kapan pakai dataset dari katalog?
- Butuh data real untuk latihan NLP, CV, atau tabular pada domain Indonesia.
- Ingin baseline kompetisi — unduh, eksplorasi di notebook, lalu submit model.
- Perlu data sintesis aman dari Ruang Ide untuk eksperimen tanpa PII.
Punya dataset worth sharing?
Masuk dan publikasikan data terbuka — bantu praktisi lain mulai eksplorasi lebih cepat.
Publikasikan dataset pertama