Penjelasan Laporan P1
Dari Kurva Rotasi ke Pelensaan Lemah: Menguji Respons Gravitasi Rata-Rata EFT
Simak laporan evaluasi asli:
1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc
2. Gemini: https://gemini.google.com/share/773ec96d75a0
3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04
4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46
5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm
Catatan Baca |
Ini adalah versi penjelasan, bukan laporan akademik terpisah. Dokumen ini didasarkan pada laporan P1 asli, mempertahankan gambar dan tabel kunci, serta menambahkan penjelasan bahasa umum tentang arti setiap langkah utama. |
Panduan ini hanya menjelaskan kesimpulan P1 di bawah set data, buku besar parameter, dan protokol statistik yang telah ditetapkannya: dalam uji gabungan kurva rotasi galaksi (RC) dan pelensaan lemah galaksi–galaksi (GGL), model respons gravitasi rata-rata EFT jelas mengungguli baseline minimal DM_RAZOR yang diuji di sini. |
Panduan ini tidak menafsirkan P1 sebagai klaim bahwa “materi gelap telah ditumbangkan.” P1 hanyalah langkah pertama dalam eksperimen seri P. Ia menguji satu lapisan EFT yang dapat diamati—“dasar gravitasi rata-rata”—bukan seluruh isi kerangka EFT lengkap. |
0 | Memahami P1 dalam Lima Menit: Apa yang Sebenarnya Diuji?
Bayangkan P1 sebagai uji konsistensi lintas-probe. Uji ini tidak hanya bertanya apakah suatu model dapat mencocokkan satu set data. Sebaliknya, P1 menempatkan dua pembacaan gravitasi yang sangat berbeda di bangku audit yang sama: kurva rotasi (RC) membaca dinamika di dalam piringan galaksi, sedangkan pelensaan lemah galaksi-galaksi (GGL) membaca respons gravitasi terproyeksi pada skala yang lebih besar.
- RC ibarat speedometer: ia memberi tahu seberapa cepat gas dan bintang berputar pada berbagai radius di piringan galaksi.
- GGL ibarat timbangan: dengan mengukur bagaimana galaksi latar depan sedikit membengkokkan cahaya dari galaksi latar belakang, ia menyimpulkan distribusi gravitasi/massa rata-rata di sekitar galaksi pada skala yang lebih besar.
- Pertanyaan inti P1 adalah: dapatkah model yang sama terlebih dahulu belajar pola dari RC, lalu memindahkan pola itu ke GGL dan tetap masuk akal?
P1 dalam Satu Kalimat |
P1 menaikkan ambang perbandingan dari “apakah ia cocok dengan satu probe?” menjadi “apakah ia menutup lintas-probe?” Suatu model lebih mungkin menangkap struktur gravitasi yang dibagi RC dan GGL hanya jika ia berkinerja baik di bawah pemetaan yang benar dan sinyalnya runtuh setelah pemetaan diacak. |
Tabel 0 | Angka Inti P1 dan Cara Membacanya
Metrik | Pembacaan dalam P1 / P1A | Makna Bahasa Umum |
Pencocokan gabungan ΔlogL_total | Dalam perbandingan utama teks, EFT berada 1155–1337 di atas DM_RAZOR | Selisih skor total di dua set data; semakin besar berarti penjelasan keseluruhan lebih baik. |
Kekuatan penutupan ΔlogL_closure | Dalam perbandingan utama teks, EFT berada pada 172–281, sedangkan DM_RAZOR 127 | Kemampuan memprediksi GGL setelah inferensi hanya dari RC; semakin besar berarti konsistensi mandiri lintas-probe lebih kuat. |
Shuffle kontrol negatif | Setelah RC-bin→GGL-bin diacak, sinyal penutupan EFT turun menjadi 6–23 | Jika korespondensi yang benar dirusak, keunggulan seharusnya hilang; semakin tajam keruntuhannya, semakin baik ia menyingkirkan sinyal palsu. |
Uji tekanan multi-DM P1A | DM 7+1 + DM_STD, dengan EFT_BIN tetap sebagai pembanding | P1A tidak hanya melihat baseline minimal DM_RAZOR. Ia menempatkan beberapa cabang penguatan DM yang berdimensi rendah dan dapat diaudit ke dalam protokol penutupan yang sama. |
1 | Mengapa P1 Perlu Dilakukan? Di Mana Kosmologi Skala Galaksi Tersendat?
Masalah pada skala galaksi tetap sulit karena “kebutuhan gravitasi/massa tambahan” bukan hanya fenomena kurva rotasi. Banyak pengamatan menunjukkan hubungan yang ketat antara materi barionik yang terlihat di galaksi dan pembacaan dinamika/pelensaan yang sebenarnya. Bagi jalur materi gelap, ini berarti halo gelap, umpan balik barionik, riwayat pembentukan galaksi, dan galat sistematik pengamatan harus dikoordinasikan dengan sangat halus. Bagi jalur gravitasi non-materi-gelap, ini berarti model tidak boleh hanya terlihat bagus pada RC, tetapi juga harus tetap berlaku pada pelensaan lemah, hukum skala populasi, dan kontrol negatif.
Itulah motivasi P1. Uji ini tidak berangkat dari “materi gelap salah” atau “EFT pasti benar.” P1 membawa satu klaim yang dapat diuji ke meja audit: apakah respons gravitasi rata-rata dalam EFT dapat meninggalkan sinyal yang dapat direproduksi dan dipindahkan dalam penutupan lintas-probe RC→GGL.
Konteks Literatur Eksternal: Mengapa Jendela RC+GGL Penting |
Radial acceleration relation (RAR) yang diajukan McGaugh, Lelli, dan Schombert pada 2016 menunjukkan korelasi ketat dengan scatter rendah antara percepatan teramati yang dilacak kurva rotasi dan percepatan yang diprediksi dari materi barionik. Ini membuat “penggandengan barion–respons gravitasi” menjadi hal yang tidak dapat dihindari bagi teori skala galaksi. |
Brouwer et al. (2021) menggunakan pelensaan lemah KiDS-1000 untuk memperluas RAR ke percepatan yang lebih rendah dan radius yang lebih besar, sambil membandingkan MOND, gravitasi emergen Verlinde, dan model LambdaCDM. Mereka juga mencatat bahwa perbedaan antara galaksi tipe awal dan tipe akhir, halo gas, serta koneksi galaksi–halo tetap menjadi isu penjelasan kunci. |
Mistele et al. (2024) selanjutnya menggunakan pelensaan lemah untuk menyimpulkan kurva kecepatan sirkular galaksi terisolasi, dan melaporkan tidak adanya penurunan jelas hingga beberapa ratus kpc bahkan kira-kira 1 Mpc, selaras dengan BTFR. Ini menunjukkan bahwa pelensaan lemah sedang menjadi pembacaan eksternal penting untuk menguji respons gravitasi skala galaksi. |
Karena itu, nilai P1 bukanlah bahwa ia “pertama kali membahas RC dan GGL bersama-sama.” Nilainya terletak pada penempatan keduanya dalam sebuah protokol yang dapat diaudit: pemetaan tetap, buku besar parameter, penutupan RC-only→GGL, kontrol negatif shuffle, dan uji tekanan multi-DM P1A.
2 | Apa Arti EFT dalam P1? Ini Bukan Effective Field Theory
Di sini, EFT merujuk pada Teori filamen energi (Energy Filament Theory, EFT), bukan Effective Field Theory yang lazim digunakan dalam fisika. Dalam laporan teknis P1, EFT digunakan secara sangat terkendali: ia tidak masuk ke perbandingan sebagai teori final yang lengkap, melainkan terlebih dahulu dipadatkan menjadi parameterisasi “respons gravitasi rata-rata” yang dapat diamati, dicocokkan, dan dibantah.
Dengan bahasa sederhana, P1 tidak mulai dengan membahas semua sumber mikroskopis gravitasi tambahan, dan tidak berusaha membuktikan seluruh kerangka EFT sekaligus. Ia mengajukan pertanyaan yang lebih sempit dan lebih keras: jika pada skala galaksi ada sejenis respons gravitasi tambahan rata-rata, dapatkah respons itu lebih dahulu menjelaskan RC, lalu bermigrasi untuk memprediksi GGL?
Bagian EFT Mana yang Diuji P1? |
P1 menargetkan “dasar gravitasi rata-rata”: kontribusi rata-rata yang stabil secara statistik dan dapat dipindahkan lintas sampel. |
P1 belum menangani “dasar stokastik/kebisingan”: suku acak, perbedaan individual, atau scatter tambahan yang mungkin diperkenalkan oleh proses fluktuasi yang lebih mikroskopis. |
P1 juga tidak membahas mekanisme mikroskopis lengkap, kelimpahan, masa hidup, atau kendala kosmologis global. Ini adalah langkah pertama dalam eksperimen seri P, bukan vonis akhir. |
3 | Rencana Seri P1: Mengapa Dimulai dari “Dasar Rata-Rata”?
Seri P dapat dipahami sebagai program pencarian observasional EFT. Ia tidak membentangkan semua klaim sekaligus; sebaliknya, ia mengisolasi bagian yang paling mudah diuji dengan data publik. Strategi P1 adalah menguji komponen rata-rata terlebih dahulu: jika respons gravitasi rata-rata bahkan tidak dapat menutup dari RC ke GGL, maka pembahasan tentang komponen kebisingan yang lebih rumit atau mekanisme mikroskopis kehilangan pintu masuknya.
Tabel 1 | Posisi Berlapis Seri P
Lapisan | Pertanyaan yang Diajukan | Peran dalam P1 |
P1 | Dapatkah respons gravitasi rata-rata menutup dalam RC→GGL? | Pertanyaan utama laporan saat ini |
P1A | Jika sisi DM diperkuat, apakah kesimpulan tetap stabil? | Lampiran B: uji tekanan DM 7+1 + DM_STD |
Pekerjaan seri P berikutnya | Dapatkah protokol diperluas ke lebih banyak data, probe, dan sistematika yang lebih kompleks? | Arah kerja mendatang |
Pertanyaan tingkat lebih dalam | Bagaimana suku rata-rata, suku kebisingan, dan mekanisme mikroskopis terhubung? | Di luar cakupan kesimpulan P1 |
4 | Apa Datanya? Apa yang Diceritakan RC dan GGL?
4.1 Kurva Rotasi (RC): “Pengukur Kecepatan” di Dalam Piringan Galaksi
Kurva rotasi mencatat seberapa cepat gas dan bintang mengorbit pusat galaksi pada berbagai radius. Semakin cepat rotasinya, semakin kuat gaya sentripetal yang dibutuhkan pada radius tersebut—dan karenanya semakin kuat gravitasi efektifnya. P1 menggunakan basis data SPARC; setelah prapemrosesan, 104 galaksi dengan 2.295 titik data kecepatan dimasukkan dan dibagi menjadi 20 RC-bin.
4.2 Pelensaan Lemah (GGL): “Timbangan Gravitasi” pada Skala yang Lebih Besar
Pelensaan lemah galaksi–galaksi mengukur bagaimana galaksi latar depan sedikit membengkokkan cahaya dari galaksi latar belakang. Ini berkaitan dengan respons gravitasi terproyeksi pada radius yang lebih besar, setara skala halo, dan tidak bergantung pada rincian dinamika gas galaksi. P1 menggunakan data GGL publik KiDS-1000 / Brouwer et al. 2021: 4 bin massa bintang, masing-masing dengan 15 titik radius, total 60 titik data, dan menggunakan kovarians lengkap.
4.3 Pemetaan Tetap: Mengapa 20 RC-bin → 4 GGL-bin Itu Penting
P1 menghubungkan 20 RC-bin dengan 4 GGL-bin melalui aturan tetap: setiap GGL-bin berkorespondensi dengan 5 RC-bin, lalu digabungkan dengan rata-rata berbobot jumlah galaksi. Pemetaan ini dipertahankan sama untuk semua model dan menjadi batas keras bagi uji penutupan serta perbandingan yang adil.
Mengapa Tidak Menyetel Pemetaan Setelahnya? |
Jika setelah melihat hasil seseorang dapat memilih “RC-bin mana yang berkorespondensi dengan GGL-bin mana,” model bisa saja membuat penutupan secara buatan dengan mengatur ulang korespondensi. P1 mengunci pemetaan 20→4 sejak awal dan sengaja merusaknya dengan kontrol negatif shuffle, tepat untuk menilai apakah sinyal penutupan benar-benar bergantung pada korespondensi yang masuk akal secara fisik. |
5 | Model dan Metode: Apa Sebenarnya yang Dibandingkan P1?
5.1 Sisi EFT: Respons Gravitasi Rata-Rata Berdimensi Rendah
Di sisi EFT, sebuah suku kecepatan tambahan berdimensi rendah digunakan untuk menggambarkan respons gravitasi rata-rata. Bentuk suku tambahan ini dikendalikan oleh fungsi kernel tak berdimensi f(r/ℓ), dengan ℓ sebagai skala global, sementara amplitudonya diberikan menurut RC-bin. Fungsi kernel yang berbeda mewakili kemiringan awal, kecepatan transisi, dan ekor jarak-jauh yang berbeda; semuanya dipakai untuk uji tekanan ketangguhan.
5.2 Sisi DM: Perbandingan Utama dalam Teks dan Lampiran P1A Harus Dibaca Terpisah
Dalam perbandingan utama di teks, DM_RAZOR adalah baseline NFW yang diminimalkan dan dapat diaudit: ia menggunakan hubungan c–M tetap dan tidak memasukkan scatter halo-ke-halo, kontraksi adiabatik, core akibat umpan balik, ketidaksferisan, maupun komponen lingkungan. Kelebihan rancangan ini adalah derajat bebasnya terkendali dan mudah direproduksi; kekurangannya, ia tidak mewakili seluruh LambdaCDM atau semua model halo materi gelap.
Karena itu, dalam Lampiran B (P1A), sisi DM diubah menjadi serangkaian “uji tekanan terstandar.” Tanpa mengubah pemetaan bersama atau protokol penutupan, P1A secara bertahap menambahkan cabang penguatan berdimensi rendah seperti SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m, serta baseline gabungan DM_STD, sambil mempertahankan EFT_BIN sebagai pembanding. P1A dapat dipahami begini: bukan hanya membandingkan dengan satu baseline DM minimal, melainkan memasukkan serangkaian mekanisme DM yang umum dan dapat diaudit ke dalam satu “penggaris penutupan” yang sama.
Pembingkaian Kesimpulan yang Tepat dalam Dokumen Ini |
Teks utama: keluarga EFT secara substansial mengungguli DM_RAZOR minimal dalam perbandingan utama. |
Lampiran B / P1A: di bawah beberapa cabang penguatan DM yang berdimensi rendah dan dapat diaudit serta uji tekanan DM_STD, sebagian pencocokan gabungan DM membaik, tetapi kekuatan penutupan tidak menghapus keunggulan EFT_BIN. |
Karena itu, pernyataan paling aman adalah: dalam cakupan data, pemetaan, buku besar parameter, dan protokol penutupan P1/P1A, respons gravitasi rata-rata EFT menunjukkan konsistensi lintas-data yang lebih kuat; ini tidak sama dengan mengecualikan semua model materi gelap. |
5.3 Uji Penutupan: Sintaks Eksperimental Terpenting P1
1. Lakukan pencocokan hanya dengan RC untuk memperoleh sekumpulan sampel posterior RC-only.
2. Jangan menyetel ulang dengan GGL; gunakan posterior RC secara langsung untuk memprediksi GGL.
3. Gunakan kovarians lengkap untuk menghitung skor prediksi GGL di bawah pemetaan yang benar, logL_true.
4. Acak korespondensi RC-bin→GGL-bin untuk menghitung skor kontrol negatif, logL_perm.
5. Kurangi keduanya untuk memperoleh kekuatan penutupan: ΔlogL_closure = <logL_true> − <logL_perm>.
Analogi Bahasa Umum |
Uji penutupan seperti ujian ulang lintas-ruang. Model pertama-tama belajar pola di ruang ujian RC, lalu menjawab di ruang ujian GGL. Jika yang dipelajari adalah aturan bersama, bukan trik lokal, ia tetap harus menjawab dengan baik setelah pindah ruang; jika korespondensi antarruang ujian sengaja diacak, keunggulannya harus menghilang. |
5.4 Sebelum Membaca Tabel Teknis: Empat Pintu Masuk
Tabel 5.4 | Jalur Baca untuk Kumpulan Tabel Teknis Mendatar Berikutnya
Pintu Masuk | Apa yang Dilihat | Mengapa Penting |
Tabel S1a | Skor total pencocokan gabungan RC+GGL | Menjawab: “Ketika dua set data dilihat bersama, penjelasan keseluruhan siapa yang lebih kuat?” |
Tabel S1b | Kekuatan penutupan, shuffle, dan pemindaian ketangguhan | Menjawab: “Dapatkah hal yang dipelajari dari RC berpindah ke GGL?” |
Tabel B0 | Definisi beberapa cabang penguatan DM dalam P1A | Mencegah P1 direduksi menjadi “hanya perbandingan dengan DM_RAZOR minimal.” |
Tabel B1 | Scoreboard penutupan dan pencocokan gabungan P1A | Memeriksa apakah keunggulan penutupan hilang setelah DM diperkuat. |
Catatan Tata Letak |
Halaman lanskap dimulai pada halaman berikutnya agar tabel lebar dari laporan asli dapat dipertahankan utuh tanpa menghapus kolom atau memampatkannya hingga tidak terbaca. Teks utama sudah memberikan pembacaan bahasa umum; tabel teknis lanskap ditujukan bagi pembaca yang perlu memverifikasi nilai dan cabang model. |
Gambar 0.1 | Alur Kerja Uji Penutupan P1 dalam Satu Diagram

Catatan: rantai bagian atas adalah “uji penutupan” (cocokkan hanya RC → gunakan posterior RC untuk memprediksi GGL); rantai bagian bawah adalah “pencocokan gabungan” (skor RC+GGL secara bersama). Di sisi kanan, pemetaan benar dibandingkan dengan pemetaan yang diacak untuk memperoleh kekuatan penutupan ΔlogL.
6 | Tabel Teknis Kunci: Tabel Utama dari Laporan Asli dan Tabel P1A
Tabel S1a | Metrik Perbandingan Utama Pencocokan Gabungan (RC+GGL, Strict; dipertahankan dari laporan asli)
Model (workspace) | Kernel W | k | Joint logL_total (best) | ΔlogL_total vs DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Tabel S1b | Metrik Penutupan dan Ketangguhan (Strict; dipertahankan dari laporan asli)
Model (workspace) | ΔlogL penutupan (true-perm) | ΔlogL setelah shuffle kontrol negatif | Rentang ΔlogL pemindaian σ_int | Rentang ΔlogL pemindaian R_min | Rentang ΔlogL pemindaian cov-shrink |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
Tabel B0 | Definisi Cabang Penguatan DM dalam P1A (dipertahankan dari Lampiran B laporan asli)
Workspace | dm_model | Parameter baru (≤1) | Motivasi fisik (inti) | Prinsip implementasi (ramah audit) |
|---|---|---|---|---|
DM_RAZOR | NFW (fixed c–M, no scatter) | — | Baseline halo LambdaCDM minimal yang dapat diaudit; digunakan sebagai perbandingan ketat dengan EFT | Pemetaan bersama tetap; buku besar parameter ketat; hanya digunakan sebagai baseline perbandingan relatif |
DM_RAZOR_SCAT | NFW + c–M scatter (legacy) | σ_logc | Hubungan c–M memiliki scatter; didekati dengan scatter log-normal satu-parameter | ≤1 parameter baru; tetap memakai pemetaan bersama; kenaikan penutupan menjadi kriteria penerimaan |
DM_RAZOR_AC | NFW + Adiabatic Contraction (legacy) | α_AC | Infall barionik dapat menyebabkan kontraksi adiabatik halo; didekati dengan kekuatan satu-parameter | ≤1 parameter baru; pemetaan tidak berubah; melaporkan perubahan AICc/BIC dan kenaikan penutupan |
DM_RAZOR_FB | NFW + feedback core (legacy) | log r_core | Umpan balik dapat membentuk core bagian dalam; didekati dengan skala core satu-parameter | ≤1 parameter baru; bingkai penutupan/kontrol negatif sama; perbaikan RC-only bukan satu-satunya tujuan |
DM_HIER_CMSCAT | Hierarchical c–M scatter + prior | σ_logc (hier) | c_i∼logN(c(M_i),σ_logc) hierarkis yang lebih standar; memengaruhi posterior gabungan RC dan GGL | Prior eksplisit; latent c_i dimarginalkan; tetap berdimensi rendah dan dapat diaudit |
DM_CORE1P | 1‑parameter core proxy (coreNFW/DC14‑inspired) | log r_core | Menggunakan proksi core satu-parameter untuk efek utama umpan balik barionik, menghindari rincian pembentukan bintang berdimensi tinggi | Mengutip literatur standar; ≤1 parameter baru; diikat pada uji penutupan |
DM_RAZOR_M | NFW + lensing shear‑calibration nuisance | m_shear (GGL) | Menyerap sistematika kunci di sisi pelensaan lemah dengan parameter efektif, mengurangi risiko memperlakukan sistematika sebagai fisika | Nuisance dicatat eksplisit; tidak boleh bereaksi balik ke RC; hasil terutama dinilai dari ketangguhan penutupan |
DM_STD | Standardized DM baseline (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Membawa tiga keberatan paling umum ke dalam satu baseline terstandardisasi yang masih berdimensi rendah | Melaporkan buku besar parameter dan kriteria informasi bersama; penutupan adalah metrik utama; digunakan sebagai pembanding pertahanan DM terkuat |
Tabel B1 | Scoreboard P1A (semakin besar semakin baik; dipertahankan dari Lampiran B laporan asli)
Cabang model (workspace) | Δk | RC-only best logL_RC (Δ) | Kekuatan penutupan ΔlogL_closure (Δ) | Joint best logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Cara Membaca Tabel B1 (Scoreboard P1A) |
• Δk: derajat bebas yang baru ditambahkan (lebih besar berarti model lebih kompleks; lebih kompleks tidak otomatis berarti lebih baik). / • Fokus pada dua kolom: kekuatan penutupan ΔlogL_closure(Δ) (lebih besar berarti konsistensi transfer lebih tinggi) dan Joint best logL_total(Δ) (skor total pencocokan gabungan). / • Nilai dalam tanda kurung, (Δ), adalah selisih relatif terhadap DM_RAZOR, sehingga perbandingan langsung lebih mudah. |
• Pertanyaan utama tabel ini adalah apakah keunggulan penutupan hilang setelah baseline DM “diperkuat secara wajar.” / • Petunjuk baca: DM_STD meningkatkan skor gabungan secara mencolok, tetapi kekuatan penutupannya turun; EFT_BIN tetap lebih tinggi dalam kekuatan penutupan. |
Dalam satu kalimat: di dalam kumpulan penguatan DM yang berdimensi rendah dan dapat diaudit ini, memperbaiki pencocokan gabungan tidak otomatis menghasilkan penutupan yang lebih kuat; penutupan, yakni keterpindahan, tetap menjadi kriteria kunci. |
7 | Bagaimana Membaca Hasil Utama?
7.1 Pencocokan Gabungan: Jika Dua Set Data Dilihat Bersama, Skor Perbandingan Utama EFT Lebih Tinggi
Tabel S1a dan Gambar S4 menunjukkan bahwa, dengan data yang sama, pemetaan bersama yang sama, dan skala parameter yang kira-kira sama, keluarga EFT memiliki ΔlogL_total gabungan sebesar 1155–1337 relatif terhadap DM_RAZOR. Pembaca umum dapat memahaminya begini: di bawah aturan penilaian yang sama untuk gabungan dua data RC dan GGL, model perbandingan utama EFT memperoleh skor total yang lebih tinggi.
7.2 Uji Penutupan: Hal yang Paling Ingin Ditekankan P1 Adalah “Keterpindahan”
Kekuatan penutupan yang tinggi berarti parameter yang disimpulkan hanya dari RC dapat memprediksi GGL dengan lebih baik tanpa melihat GGL kembali. Dalam laporan P1, ΔlogL_closure EFT berada pada 172–281, sedangkan DM_RAZOR 127. Hasil ini lebih penting daripada sekadar “masing-masing bisa cocok dengan baik,” karena ia membatasi kebebasan model pada data kedua.
7.3 Kontrol Negatif: Mengapa “Runtuhnya Sinyal” Justru Hal yang Baik?
Setelah P1 mengacak korespondensi pengelompokan RC-bin→GGL-bin, sinyal penutupan EFT turun ke kisaran 6–23. Bagi pembaca umum, langkah ini seperti pemeriksaan anti-curang: jika keunggulan penutupan hanya disebabkan oleh kode, satuan, kovarians, atau kebetulan pencocokan, maka pengacakan korespondensi mungkin tetap memberi keunggulan. Namun hasil aktualnya adalah keunggulan itu runtuh, yang berarti ia bergantung pada pemetaan yang benar.

Gambar S3 | Kekuatan Penutupan (semakin besar semakin baik): keunggulan rata-rata log-likelihood untuk prediksi RC-only → GGL.
Cara Membaca Gambar Ini |
Gambar ini adalah inti P1. Semakin tinggi batangnya, semakin baik informasi yang dipelajari dari RC berpindah ke GGL. |
Keluarga EFT secara keseluruhan lebih tinggi daripada DM_RAZOR, yang menunjukkan penutupan lintas-probe EFT lebih kuat dalam eksperimen “belajar dari RC terlebih dahulu, lalu memprediksi GGL”. |

Gambar S4 | Keunggulan Pencocokan Gabungan (semakin besar semakin baik): best logL_total RC+GGL relatif terhadap DM_RAZOR.
Cara Membaca Gambar Ini |
Gambar ini menunjukkan skor total setelah RC dan GGL digabungkan. |
Semua model EFT jauh di atas 0, yang menunjukkan bahwa keunggulan EFT dalam perbandingan utama bukan efek lokal satu titik, melainkan pola keseluruhan dalam analisis gabungan. |

Gambar R1 | Kontrol Negatif: Sinyal Penutupan Turun Tajam Setelah Pengacakan Pengelompokan.
Cara Membaca Gambar Ini |
Gambar ini menunjukkan bahwa begitu hubungan binning RC↔GGL yang benar diganggu, sinyal penutupan turun tajam. |
Ini membuat hasil P1 lebih tampak sebagai konsistensi nyata dalam pemetaan lintas-data, bukan kebetulan numerik yang dapat diperoleh di bawah pemetaan sembarang. |
8 | Ketangguhan dan Kontrol: Bagaimana P1 Menghindari Sekadar “Cocok yang Tampak Bagus”?
Tantangan paling mudah terhadap laporan teknis adalah bertanya apakah keunggulan muncul dari satu pengaturan kebisingan, satu pemotongan data wilayah pusat, satu perlakuan kovarians, atau overfitting. P1 menjawabnya dengan banyak uji tekanan.
Tabel 2 | Cara Membaca Uji Ketangguhan dan Kontrol Negatif P1
Uji | Kekhawatiran yang Ingin Disingkirkan | Cara Membacanya |
Pemindaian σ_int | Jika RC mengandung scatter tambahan yang tidak diketahui, apakah kesimpulan tetap stabil? | Setelah galat RC dilonggarkan, peringkat EFT dan skala keunggulannya tetap stabil. |
Pemindaian R_min | Jika wilayah pusat galaksi tidak sepenuhnya dipercaya, apakah kesimpulan tetap stabil? | Setelah wilayah pusat dipangkas, EFT tetap mempertahankan keunggulan positif. |
Pemindaian cov-shrink | Jika estimasi kovarians GGL tidak pasti, apakah kesimpulan tetap stabil? | Setelah kovarians disusutkan ke arah matriks diagonal, keunggulan tidak sensitif. |
Tangga ablasi | Apakah EFT mengandalkan kompleksitas yang tidak perlu untuk memaksakan pencocokan? | EFT_BIN lengkap didukung oleh kriteria informasi. |
Prediksi LOO pada data yang ditahan | Apakah model hanya menjelaskan data yang sudah pernah dilihat? | Setelah satu GGL-bin ditahan, model tetap menunjukkan performa generalisasi yang kuat. |
Shuffle RC-bin | Apakah penutupan berasal dari pemetaan yang benar? | Penutupan turun setelah pengelompokan diacak, mendukung ketergantungan pada pemetaan. |

Gambar R2 | Rentang ΔlogL_total pada Pemindaian σ_int (semakin besar semakin baik).
Cara Membaca Gambar Ini |
Menguji apakah keunggulan EFT tetap ada setelah perubahan asumsi scatter intrinsik RC. |

Gambar R3 | Rentang ΔlogL_total pada Pemindaian R_min (semakin besar semakin baik).
Cara Membaca Gambar Ini |
Menguji apakah keunggulan EFT tetap stabil setelah wilayah pusat yang kompleks dipangkas. |

Gambar R4 | Rentang ΔlogL_total pada Pemindaian cov-shrink (semakin besar semakin baik).
Cara Membaca Gambar Ini |
Menguji apakah peringkat sensitif terhadap perubahan perlakuan kovarians pelensaan lemah. |

Gambar R5 | Tangga Ablasi EFT_BIN (AICc, semakin kecil semakin baik).
Cara Membaca Gambar Ini |
Menguji apakah EFT_BIN lengkap diperlukan untuk menjelaskan data, bukan sekadar menambahkan parameter yang tidak perlu. |

Gambar R6 | LOO: Distribusi Log-Likelihood untuk Bin yang Ditahan.
Cara Membaca Gambar Ini |
Menguji apakah model masih memiliki performa prediktif pada GGL-bin yang belum pernah dilihat. |

Gambar R7 | Kontrol Negatif: Pemetaan yang Diacak Menyebabkan Penurunan Jelas pada mean logL_true Penutupan.
Cara Membaca Gambar Ini |
Lebih lanjut menunjukkan, dari sudut pandang mean logL_true, bahwa penutupan bergantung pada pemetaan lintas-data yang benar. |
9 | P1A: Mengapa “Beberapa Model DM dalam Lampiran” Adalah Koreksi Kunci
Bagian ini tidak bertanya, “Apakah EFT hanya mengalahkan satu baseline minimal DM_RAZOR?” Ia bertanya apakah kesimpulan uji penutupan dan pencocokan gabungan berubah ketika baseline DM diperkuat dalam rentang yang berdimensi rendah, dapat direproduksi, dan memiliki buku besar parameter yang jelas (P1A). Dengan kata lain, tujuan P1A adalah menurunkan keberatan “Anda hanya memilih baseline DM yang terlalu lemah,” lalu mendorong diskusi ke pertanyaan: di bawah serangkaian penguatan DM yang dapat diaudit, apakah perbedaan performa penutupan tetap ada?
P1A tidak dirancang untuk menghabiskan semua kemungkinan pemodelan halo LambdaCDM, juga tidak mengubah sisi DM menjadi alat pencocok berdimensi tinggi yang tidak dapat diaudit. Ia memilih penguatan berdimensi rendah, dapat direproduksi, dan jelas buku besar parameternya: scatter konsentrasi, kontraksi adiabatik, core umpan balik, prior scatter c–M berlapis, proksi core satu-parameter, nuisance shear-calibration pelensaan lemah, serta DM_STD gabungan.
Pembacaan Utama P1A |
Di antara tiga cabang legacy, hanya feedback/core yang menghasilkan kenaikan bersih kecil pada kekuatan penutupan; SCAT dan AC tidak menghasilkan kenaikan penutupan bersih. |
DM_HIER_CMSCAT, DM_RAZOR_M, dan DM_CORE1P berdampak sangat kecil pada kekuatan penutupan atau tidak menunjukkan perbaikan bersih yang signifikan. |
DM_STD dapat memperbaiki joint logL secara substansial, tetapi kekuatan penutupannya menurun, yang mengisyaratkan bahwa ia terutama meningkatkan fleksibilitas pencocokan gabungan, bukan daya prediksi transfer RC→GGL. |
EFT_BIN tetap mempertahankan kekuatan penutupan yang lebih tinggi dan keunggulan pencocokan gabungan dalam Tabel B1 P1A; karena itu, klaim inti P1 tidak boleh direduksi menjadi “ia hanya mengalahkan DM_RAZOR minimal.” |

Gambar B1 | Scoreboard P1A: ΔlogL Penutupan dan Gabungan Relatif terhadap Baseline (semakin besar semakin baik).
Cara Membaca Gambar Ini |
Gambar ini menunjukkan performa beberapa cabang penguatan DM relatif terhadap baseline. |
Maknanya bukan “semua DM dikecualikan,” melainkan ini: dalam penguatan DM berdimensi rendah dan dapat diaudit yang dipilih P1A, memperkuat DM tidak menghapus keunggulan penutupan EFT_BIN. |
10 | Mengapa Eksperimen P1 Penting
10.1 Makna Metodologis: Menempatkan “Penutupan Lintas-Probe” di Atas “Pencocokan Satu-Probe”
Teori skala galaksi mudah terjebak dalam perdebatan apakah suatu model dapat mencocokkan satu kumpulan kurva rotasi tertentu. P1 menaikkan pertanyaannya satu tingkat: dapatkah parameter yang dipelajari dari RC memprediksi pelensaan lemah tanpa menyetel ulang ke GGL? Ini mengubah P1 dari “kompetisi pencocokan” menjadi “uji prediksi transfer.”
10.2 Makna Transparansi: Memperlakukan Rantai Reproduksibilitas sebagai Bagian dari Hasil
Salah satu kontribusi penting P1 adalah merilis data, tabel dan gambar, label run, kontrol negatif, paket reproduksi, dan rantai audit secara bersama. Ini penting bagi pendukung maupun pengkritik: diskusi dapat kembali ke data publik yang sama, pemetaan yang sama, skrip yang sama, dan metrik yang sama, bukan hanya membandingkan slogan.
10.3 Makna Fisik: Uji Tekanan Kuat bagi Arah “Gravitasi Non-Materi-Gelap”
Dalam arah gravitasi non-materi-gelap, banyak model dapat menjelaskan sebagian kurva rotasi atau RAR. Tugas yang lebih sulit adalah sekaligus lolos pembacaan pelensaan lemah dan menunjukkan, di bawah kontrol negatif, bahwa sinyal bergantung pada pemetaan yang benar. Makna P1 terletak di sini: ia menempatkan respons gravitasi rata-rata EFT ke dalam protokol yang menyerupai “ujian eksternal”: RC adalah ruang latihan, GGL adalah ruang transfer, dan shuffle adalah ruang anti-curang.
10.4 Apakah Ini Eksperimen Penting untuk Bidang “Gravitasi Non-Materi-Gelap”?
Dengan hati-hati: jika pemrosesan data, paket reproduksi, dan protokol penutupan P1 tetap bertahan setelah peninjauan eksternal, maka ia dapat dipandang sebagai eksperimen penutupan RC+GGL yang layak diperhatikan serius dalam arah gravitasi non-materi-gelap / gravitasi termodifikasi. Kepentingannya bukan pada kalimat “menumbangkan materi gelap,” melainkan pada penyediaan kriteria lintas-probe yang dapat disalin, ditantang, dan diperluas.
Apakah Sudah Ada Kerangka Prediksi-Penutupan RC+GGL pada Tingkat yang Sama? |
Ada kerangka dan tradisi pengamatan yang relevan: MOND/RAR mengorganisasi banyak fenomena kurva rotasi dengan baik; pekerjaan RAR pelensaan lemah KiDS-1000 juga membandingkan MOND, gravitasi emergen Verlinde, dan model LambdaCDM; LambdaCDM juga dapat menjelaskan sebagian fenomena pelensaan lemah/dinamika melalui koneksi galaksi–halo, halo gas, dan pemodelan umpan balik. |
Namun klaim tepat P1 bukan bahwa “tidak ada kerangka lain di dunia yang dapat menjelaskan RC+GGL.” Melainkan, di bawah protokol publik P1 sendiri—pemetaan tetap, penutupan RC-only→GGL, kontrol negatif shuffle, buku besar parameter, dan uji tekanan multi-DM P1A—EFT melaporkan performa penutupan yang lebih kuat. |
Dengan kata lain, bagian P1 yang paling layak diuji secara eksternal adalah protokol perbandingannya yang konkret dan dapat direproduksi. Langkah berikut yang sangat berharga adalah melihat apakah MOND/RAR, LambdaCDM/HOD, simulasi hidrodinamika, atau kerangka gravitasi termodifikasi lain dapat mencapai skor penutupan yang sama atau lebih tinggi di bawah protokol yang sama. |
11 | Apa yang Dapat dan Tidak Dapat Disimpulkan P1?
Tabel 3 | Batas Kesimpulan P1
Dapat Disimpulkan | Di bawah data RC+GGL P1, pemetaan tetap, dan protokol perbandingan utama, keluarga EFT memiliki skor pencocokan gabungan dan kekuatan penutupan yang lebih tinggi daripada DM_RAZOR minimal. |
Dapat Disimpulkan | Dalam rentang penguatan DM berdimensi rendah dan dapat diaudit milik P1A, beberapa penguatan DM tidak menghapus keunggulan penutupan EFT_BIN. |
Dapat Disimpulkan | Kontrol negatif shuffle menunjukkan bahwa sinyal penutupan bergantung pada pemetaan lintas-data yang benar dan tidak dapat diperoleh di bawah pemetaan sembarang. |
Tidak Dapat Disimpulkan | Tidak dapat dikatakan bahwa P1 telah menumbangkan semua model materi gelap. P1A masih belum mencakup ketidaksferisan, ketergantungan lingkungan, koneksi galaksi–halo yang kompleks, umpan balik berdimensi tinggi, atau simulasi kosmologis penuh. |
Tidak Dapat Disimpulkan | Tidak dapat dikatakan bahwa kerangka EFT lengkap telah dibuktikan dari prinsip pertama. P1 hanya menguji lapisan fenomenologis respons gravitasi rata-rata. |
Tidak Dapat Disimpulkan | Tidak dapat dikatakan bahwa semua sistematika telah disingkirkan. P1 memberikan bukti ketangguhan hanya dalam uji tekanan dan cakupan audit yang tercantum. |
12 | Pertanyaan Umum dari Pembaca Umum
Q1: Apakah ini berarti “materi gelap tidak ada”?
Tidak. Kesimpulan P1 harus dibatasi pada data, protokol, dan model pembanding yang digunakan di sini. P1A sudah melangkah lebih jauh daripada DM_RAZOR minimal, tetapi tetap tidak mewakili semua kemungkinan model materi gelap.
Q2: Apakah ini berarti “EFT sudah terbukti”?
Juga tidak. P1 menguji EFT sebagai parameterisasi respons gravitasi rata-rata dan menunjukkan performa yang lebih kuat dalam penutupan RC→GGL; mekanisme mikroskopis dan teori lengkap bukanlah kesimpulan P1.
Q3: Mengapa tidak langsung melaporkan nilai signifikansi σ?
P1 menggunakan skor likelihood terpadu, kriteria informasi, dan selisih penutupan. ΔlogL adalah keunggulan relatif di bawah aturan penilaian yang sama; ia tidak setara dengan satu nilai σ tunggal.
Q4: Mengapa mengacak RC-bin→GGL-bin?
Ini adalah kontrol negatif. Sinyal lintas-probe yang nyata harus bergantung pada pemetaan yang benar; jika setelah diacak sinyalnya tetap sama kuat, itu justru akan menunjukkan kemungkinan bias implementasi atau sinyal palsu statistik.
Q5: Apa langkah P1 berikutnya yang paling penting?
Memperluas protokol yang sama ke lebih banyak data, lebih banyak pembanding DM, sistematika yang lebih kompleks, dan lebih banyak kerangka gravitasi termodifikasi—terutama dengan cara yang memungkinkan tim eksternal menguji ulang di bawah metrik penutupan yang sama.
13 | Glosarium Mini
Tabel 4 | Glosarium Mini
Istilah | Penjelasan Satu Kalimat |
Kurva rotasi (RC) | Hubungan radius–kecepatan rotasi dalam piringan galaksi, digunakan untuk menyimpulkan gravitasi efektif di dalam piringan. |
Pelensaan lemah (GGL) | Pengukuran distribusi gravitasi/massa rata-rata di sekitar galaksi latar depan melalui distorsi statistik bentuk galaksi latar belakang. |
Uji penutupan | Menggunakan posterior RC untuk memprediksi GGL, lalu membandingkannya dengan kontrol negatif dari pemetaan yang diacak. |
Kontrol negatif | Sengaja merusak struktur kunci untuk melihat apakah sinyal menghilang; digunakan untuk menyingkirkan sinyal palsu. |
Halo NFW | Profil kerapatan halo materi gelap yang umum digunakan dalam model materi gelap dingin. |
Hubungan c–M | Hubungan antara konsentrasi halo materi gelap c dan massa M; apakah scatter diperbolehkan memengaruhi fleksibilitas model. |
DM_STD | Cabang uji tekanan DM terstandardisasi dalam P1A yang menggabungkan beberapa penguatan DM berdimensi rendah dan satu suku nuisance pelensaan. |
ΔlogL | Selisih log-likelihood antara dua model di bawah aturan penilaian yang sama; nilai positif berarti model pertama lebih baik. |
Kovarians | Deskripsi matriks korelasi antar titik data; data pelensaan lemah biasanya memerlukan kovarians lengkap. |
14 | Jalur Baca yang Disarankan dan Pintu Masuk Sitasi
1. Pertama, baca Bagian 0–2 dari panduan ini untuk membangun kesadaran masalah P1 dan peran EFT yang sengaja dibatasi dalam P1.
2. Lalu lihat Gambar S3, Gambar S4, serta Tabel S1a/S1b untuk memahami kekuatan penutupan, pencocokan gabungan, dan kontrol negatif.
3. Jika Anda khawatir “baseline DM terlalu lemah,” langsung baca Bagian 9 serta Tabel B1 / Gambar B1.
4. Untuk verifikasi teknis, kembali ke laporan teknis P1 v1.1, Tables & Figures Supplement, dan full_fit_runpack.
Pintu Masuk Arsip Utama |
Laporan teknis P1 (tingkat rilis, Concept DOI): 10.5281/zenodo.18526334 |
Paket reproduksi penuh P1 (Concept DOI): 10.5281/zenodo.18526286 |
Basis pengetahuan terstruktur EFT (opsional, Concept DOI): 10.5281/zenodo.18853200 |
Catatan lisensi: laporan teknis menggunakan CC BY-NC-ND 4.0; paket reproduksi penuh menggunakan CC BY 4.0 (rujuk laporan teknis dan arsip Zenodo sebagai otoritatif). |
15 | Referensi dan Latar Belakang Eksternal
McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.
Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.
Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.
Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.
Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.
Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.