Lewati ke konten

Data Sintesis

Pengguna
Terakhir diperbarui 5 Juli 2026

Apa & untuk apa

Data Sintesis adalah fitur untuk menghasilkan dataset sintetis berkonteks Indonesia dari deskripsi masalah — tanpa perlu mengumpulkan data lapangan sungguhan. Cocok untuk latihan pipeline, prototyping model, demo kompetisi, atau eksperimen di Ruang Ide ketika data nyata belum tersedia.

Cara kerjanya hemat: AI hanya merancang spesifikasi (skema + aturan tiap kolom), lalu generator lokal (Faker id_ID) membuat N baris secara deterministik. Biaya token tetap kecil walau Anda meminta jutaan baris — kualitas lebih terkendali daripada AI mengarang baris satu per satu.

Setelah login, panel Job Sintesis Saya menampilkan riwayat pekerjaan dan sisa kuota hari ini.

Cara kerja

Alur Data Sintesis punya dua fase:

  1. Perencanaan — AI (mode prompt) atau Anda sendiri (mode skema manual) menentukan spesifikasi:

nama kolom, tipe data (int, float, category, name, city, phone, dll.), dan aturan (distribusi, kategori, rentang tanggal).

  1. Generasi — generator lokal membuat baris sesuai spec + seed tetap, sehingga hasil reproducible

(bisa dibuat ulang dengan spec yang sama).

Dua mode input:

ModeKuota AIKapan dipakai
**Dari masalah (prompt)**Memakai 1 rencana AIAnda punya ide masalah, belum tahu skema detail
**Skema manual**Tidak memakai kuota AIAnda sudah tahu struktur kolom yang diinginkan

Setelah job selesai, Anda bisa mengedit spec dan membuat ulang tanpa kuota AI — iterasi hemat biaya. Hasil wajib berlabel "Data Sintesis" dan spec disimpan agar transparan & reproducible.

Kapan dipakai

Cocok untuk:

  • Latihan analisis, pipeline, atau modeling tanpa data sensitif/asli.
  • Demo UMKM, transaksi, demografi Indonesia untuk portofolio atau course.
  • Mengisi kebutuhan data awal di Ruang Ide sebelum solusi tim dikerjakan.
  • Prototyping kompetisi atau baseline model sebelum data resmi tersedia.

Kurang tepat bila:

  • Anda butuh data resmi instansi — data sintesis bukan pengganti data lapangan.
  • Anda ingin data real-time dari API eksternal — gunakan Ruang Panen Data.
  • Volume sangat besar untuk produksi — pertimbangkan sumber data nyata + Pabrik Data.
Wajib: jangan menyamarkan data sintesis sebagai data resmi. Badge "Data Sintesis" selalu tampil di pratinjau, kartu, dan halaman dataset.

Langkah demi langkah

Membuat dataset sintesis

  1. Buka menu Suite Data → Data Sintesis (/synthesis).
  2. Periksa kuota di atas form: sisa rencana AI hari ini dan maks baris tier Anda.
  3. Pilih mode:
  • Dari masalah — tulis deskripsi (mis. "Transaksi harian warung makan di Bandarlampung,

kolom tanggal, produk, qty, harga").

  • Skema manual — isi tabel kolom: nama, dtype, params.
  1. Tentukan jumlah baris (n_rows) dan nama dataset.
  2. Tekan Buat — job masuk antrean.

Memantau job

  1. Halaman memantau status secara otomatis:
  • AntreMerancang (AI)Membuat dataSelesai (atau Gagal).
  1. Bila gagal, baca pesan error dan coba lagi (mis. kurangi baris atau perbaiki spec).
  2. Riwayat job tersimpan di bagian Job Saya.

Mengedit spec & membuat ulang

  1. Setelah job selesai, buka editor spec — lihat kolom, dtype, dan params.
  2. Edit aturan (mis. tambah kategori produk, ubah distribusi harga).
  3. Tekan Buat ulang dengan spec initanpa memakai kuota AI.
  4. Iterasi sampai statistik dan contoh baris sesuai kebutuhan.

Pratinjau, unduh, dan terbitkan

  1. Lihat pratinjau (20 baris pertama) sebagai tabel.
  2. Unduh CSV lewat tautan hasil.
  3. Tekan Terbitkan sebagai dataset — isi judul dan visibilitas.
  4. Dataset muncul di aset Dataset dengan label Data Sintesis + spec tampil untuk transparansi.
Dataset terbit otomatis masuk SatuDanau — siap diolah di Pabrik Data atau dikueri lewat Notebook.

Batas tier

Kuota mengikuti tier reputasi Anda. Angka berikut dari konfigurasi platform — ilustratif, angka dapat berubah.

TierRencana AI/hariMaks. baris per job
Pemula32.000
Kontributor1520.000
Ahli40100.000
Master100500.000
Grandmaster3001.000.000
Angka dapat berubah. Mode prompt memakai 1 rencana AI; mode skema manual dan buat ulang dari spec tidak memakai kuota AI. Edit spec lalu regenerate = iterasi gratis.

Poin & quest

AktivitasPoin (ilustratif)
Job sintesis selesai+10
Terbitkan dataset sintesis+10
Iterasi spec tanpa AI (regenerate)+3

Quest bertema Data Sintesis:

  1. Sintesis Pertama — buat dataset dari prompt masalah sederhana.
  2. Skema Manual — buat dataset tanpa memakai kuota AI.
  3. Iterasi Hemat — edit spec dan regenerate tanpa prompt baru.
  4. Terbitkan ke Dataset — publikasikan hasil dengan label Data Sintesis.
  5. Pipeline Latihan — olah dataset sintesis di Pabrik Data.

Masalah umum & solusi

Pesan / gejalaSolusi
**Kuota rencana AI habis**Tunggu reset harian atau naikkan tier. Gunakan mode **skema manual** alih-alih prompt.
**Baris melebihi batas tier**Kurangi `n_rows` atau naikkan tier reputasi.
**Job gagal saat merancang**Perjelas deskripsi masalah; hindari permintaan kolom/dtype yang tidak didukung.
**Statistik aneh / tidak realistis**Edit spec: perbaiki distribusi, kategori, atau params kolom; regenerate.
**Dataset tanpa label sintesis**Seharusnya otomatis — jangan hapus label. Laporkan bila badge hilang.
**Ingin data nyata, bukan sintetis**Gunakan **Ruang Panen Data** atau unggah dataset sendiri.
Data sintesis wajib berlabel "Data Sintesis" — jangan dipresentasikan sebagai data resmi pemerintah, perusahaan, atau institusi.

Fitur terkait

  • Dataset — tujuan publikasi hasil sintesis (SatuDanau).
  • Pabrik Data — olah dataset sintesis menjadi silver/gold.
  • Ruang Ide — fase data sintesis otomatis dari masalah ruang.
  • Ruang Panen Data — alternatif untuk data dari API eksternal (bukan sintetis).
  • Notebook — eksplorasi statistik dataset sintesis sebelum modeling.
  • Kompetisi — dataset sintesis bisa jadi data latih demo.