Panduan untuk pembaca umum berdasarkan P1_RC_GGL: Uji Penutupan Ketat atas Dinamika Galaksi dan Pelensaan Lemah (v1.1)
Catatan Bacaan |
Ini adalah tulisan penjelas, bukan laporan akademik terpisah. Ia didasarkan pada laporan P1 asli, mempertahankan gambar dan tabel kunci, serta menambahkan penjelasan bahasa sederhana tentang “apa artinya” pada tiap langkah penting. |
Dokumen ini hanya menjelaskan kesimpulan yang dicapai P1 di bawah dataset, buku besar parameter, dan protokol statistik yang dinyatakannya: dalam uji gabungan kurva rotasi galaksi (RC) dan pelensaan lemah galaksi–galaksi (GGL), model respons gravitasi rata-rata EFT secara substansial melampaui garis dasar minimal DM_RAZOR yang diuji di sini. |
Dokumen ini tidak membaca P1 sebagai klaim bahwa ia “menumbangkan materi gelap.” P1 hanyalah langkah pertama dalam eksperimen seri P. Ia menguji satu lapisan teramati dari EFT—“lantai gravitasi rata-rata”—bukan seluruh kerangka EFT. |
0 | Memahami P1 dalam Lima Menit: Apa Sebenarnya yang Diuji?
Anggap P1 sebagai pemeriksaan kebenaran lintas-probe. Ia tidak sekadar bertanya apakah suatu model dapat mencocokkan satu himpunan data. P1 meletakkan dua pembacaan gravitasi yang sangat berbeda di meja audit yang sama: kurva rotasi (RC) membaca dinamika di dalam piringan galaksi, sedangkan pelensaan lemah galaksi–galaksi (GGL) membaca respons gravitasi terproyeksi pada skala yang lebih besar.
- RC bekerja seperti speedometer: ia memberi tahu seberapa cepat gas dan bintang mengorbit pada berbagai radius di dalam piringan galaksi.
- GGL lebih mirip timbangan: dari pembelokan kecil cahaya latar, ia menyimpulkan distribusi gravitasi atau massa rata-rata di sekitar galaksi latar-depan.
- Pertanyaan inti P1 adalah ini: dapatkah model yang sama terlebih dahulu mempelajari pola dari RC, lalu membawa pola itu ke GGL dan tetap masuk akal?
Kalimat Inti P1 |
P1 menaikkan ambang perbandingan dari “apakah ia cocok dengan satu probe?” menjadi “apakah ia menutup lintas-probe?” Kinerja kuat pada pemetaan yang benar, lalu runtuhnya sinyal pada pemetaan yang diacak, menunjukkan bahwa suatu model mungkin menangkap struktur gravitasi yang sama-sama dibaca oleh RC dan GGL. |
Tabel 0 | Angka Inti P1 dan Cara Membacanya dalam Bahasa Sederhana
Metrik | Bacaan dalam P1 / P1A | Makna dalam Bahasa Sederhana |
ΔlogL_total pencocokan gabungan | Dalam perbandingan utama, EFT berada 1155–1337 di atas DM_RAZOR | Selisih skor total di seluruh kedua dataset; semakin tinggi berarti penjelasan keseluruhan lebih baik. |
Kekuatan penutupan ΔlogL_closure | Dalam perbandingan utama, EFT adalah 172–281; DM_RAZOR adalah 127 | Kemampuan memprediksi GGL setelah inferensi dari RC saja; semakin tinggi berarti konsistensi diri lintas-probe lebih besar. |
Pengacakan kontrol negatif | Setelah bin RC→bin GGL diacak, sinyal penutupan EFT turun menjadi 6–23 | Jika korespondensi yang benar diputus, keunggulan seharusnya menghilang; semakin tajam penurunannya, semakin kuat ia menyingkirkan kemungkinan sinyal palsu. |
Uji tekanan multi-DM P1A | DM 7+1 + DM_STD, dengan EFT_BIN dipertahankan sebagai kontrol | P1A tidak hanya memeriksa DM_RAZOR minimal; ia menempatkan beberapa cabang penguatan DM berdimensi rendah dan dapat diaudit di bawah protokol penutupan yang sama. |
1 | Mengapa P1 Perlu Dijalankan? Di Mana Kosmologi Skala Galaksi Tersendat
Masalah pada skala galaksi tetap sulit karena kebutuhan akan “gravitasi/massa tambahan” bukan hanya fenomena kurva rotasi. Banyak pengamatan menunjukkan kaitan yang erat antara materi barionik yang tampak di galaksi dan pembacaan dinamika atau pelensaan yang sesungguhnya. Bagi jalur materi gelap, ini berarti halo gelap, umpan balik barionik, sejarah pembentukan galaksi, dan sistematika pengamatan semuanya harus dikoordinasikan dengan sangat hati-hati. Bagi jalur gravitasi non-materi-gelap, ini berarti sebuah model tidak cukup terlihat bagus pada RC saja; ia juga harus bertahan pada pelensaan lemah, relasi penskalaan populasi, dan kontrol negatif.
Itulah sebabnya P1 dirancang. P1 tidak berangkat dari pernyataan “materi gelap salah” atau “EFT pasti benar.” Ia membawa satu klaim yang dapat diuji ke meja audit: apakah respons gravitasi rata-rata EFT meninggalkan sinyal yang dapat direproduksi dan dapat dipindahkan dalam penutupan lintas-probe RC→GGL.
Latar Literatur Eksternal: Mengapa Jendela RC+GGL Penting |
Relasi percepatan radial (RAR) yang diajukan McGaugh, Lelli, dan Schombert pada 2016 menunjukkan korelasi yang ketat dan bersebaran rendah antara percepatan teramati yang dilacak oleh kurva rotasi dan percepatan yang diprediksi dari materi barionik. Ini membuat kopling barion–respons gravitasi menjadi persoalan yang tak terhindarkan bagi teori skala galaksi. |
Brouwer dkk. (2021) menggunakan pelensaan lemah KiDS-1000 untuk memperluas RAR ke percepatan yang lebih rendah dan radius yang lebih besar, sambil membandingkan model MOND, emergent gravity Verlinde, dan LambdaCDM. Mereka juga mencatat bahwa perbedaan galaksi tipe awal/akhir, halo gas, dan koneksi galaksi–halo tetap menjadi isu penjelasan kunci. |
Mistele dkk. (2024) lebih lanjut menyimpulkan kurva kecepatan melingkar untuk galaksi terisolasi dari pelensaan lemah, dan melaporkan tidak adanya penurunan yang jelas hingga ratusan kpc bahkan sekitar 1 Mpc, selaras dengan BTFR. Ini menunjukkan bahwa pelensaan lemah sedang menjadi pembacaan eksternal yang penting untuk menguji respons gravitasi skala galaksi. |
Karena itu, nilai P1 bukan terletak pada fakta bahwa ia menjadi yang pertama membahas RC dan GGL bersama-sama. Nilainya terletak pada penempatan keduanya di dalam protokol yang dapat diaudit, yang dibangun dari pemetaan tetap, buku besar parameter, penutupan RC-saja→GGL, kontrol negatif pengacakan, dan uji tekanan multi-DM P1A.
2 | Apa Arti EFT dalam P1? Ini Bukan Teori Medan Efektif
Di sini, EFT berarti Teori filamen energi (Energy Filament Theory), bukan teori medan efektif (Effective Field Theory) yang lazim dalam fisika. Dalam laporan teknis P1, EFT digunakan dengan sengaja secara terbatas. Ia tidak dimasukkan sebagai teori final yang lengkap; mula-mula ia dipadatkan menjadi parameterisasi “respons gravitasi rata-rata” yang dapat diamati, siap dicocokkan, dan dapat difalsifikasi.
Dalam bahasa sederhana, P1 belum membahas setiap sumber mikroskopik dari gravitasi tambahan, dan juga tidak mencoba membuktikan seluruh kerangka EFT dalam satu langkah. Ia mengajukan pertanyaan yang lebih sempit sekaligus lebih keras: jika ada respons gravitasi tambahan rata-rata pada skala galaksi, dapatkah ia terlebih dahulu menjelaskan RC lalu memprediksi GGL?
Bagian EFT Mana yang Diuji P1? |
P1 menguji “lantai gravitasi rata-rata”: kontribusi rata-rata yang stabil secara statistik dan dapat berpindah lintas sampel. |
P1 belum menangani basis stokastik / derau: suku acak, variasi antarobjek, atau sebaran tambahan yang mungkin muncul dari proses fluktuasi yang lebih mikroskopik. |
P1 juga tidak membahas mekanisme mikroskopik penuh, kelimpahan, umur, atau kendala kosmologis global. Ia adalah langkah pertama dalam eksperimen seri P, bukan putusan akhir. |
3 | Rencana Seri P1: Mengapa Dimulai dari “Lantai Rata-rata”?
Seri P dapat dipahami sebagai program pengambilan-baca observasional EFT. Ia tidak meletakkan semua klaim di atas meja sekaligus. Sebaliknya, ia terlebih dahulu mengisolasi bagian yang paling langsung dapat diuji oleh data publik. P1 memulai dari suku rata-rata: jika respons gravitasi rata-rata tidak dapat menutup RC→GGL, maka tidak ada pintu masuk yang kokoh untuk membahas suku derau yang lebih kompleks atau mekanisme mikroskopik.
Tabel 1 | Posisi Berlapis Seri P
Lapisan | Pertanyaan yang Diajukan | Peran dalam P1 |
P1 | Dapatkah respons gravitasi rata-rata menutup RC→GGL? | Pertanyaan utama laporan saat ini |
P1A | Jika sisi DM diperkuat, apakah kesimpulannya tetap stabil? | Lampiran B: uji tekanan DM 7+1 + DM_STD |
Pekerjaan seri P berikutnya | Dapatkah protokol diperluas ke lebih banyak data, lebih banyak probe, dan sistematika yang lebih kompleks? | Arah pekerjaan masa depan |
Pertanyaan yang lebih dalam | Bagaimana suku rata-rata, suku derau, dan mekanisme mikroskopik saling terhubung? | Di luar cakupan kesimpulan P1 |
4 | Apa Datanya? Apa yang Diberitahukan RC dan GGL?
4.1 Kurva Rotasi (RC): Pengukur Kecepatan Piringan
Kurva rotasi merekam seberapa cepat gas dan bintang mengorbit pusat galaksi pada radius yang berbeda-beda. Semakin cepat mereka bergerak, semakin besar gaya sentripetal yang dibutuhkan pada radius tersebut, yang berarti tarikan gravitasi efektif yang lebih kuat. P1 menggunakan basis data SPARC; setelah praproses, data ini mencakup 104 galaksi, 2.295 titik data kecepatan, dan 20 bin RC.
4.2 Pelensaan Lemah (GGL): Timbangan Gravitasi pada Skala Lebih Besar
Pelensaan lemah galaksi–galaksi mengukur bagaimana galaksi latar-depan sedikit membelokkan cahaya dari galaksi latar-belakang. Ia berkaitan dengan respons gravitasi terproyeksi pada skala yang lebih besar, mirip halo, dan tidak bergantung pada rincian dinamika gas di piringan galaksi. P1 menggunakan data GGL publik dari KiDS-1000 / Brouwer dkk. 2021: empat bin massa bintang, 15 titik radial per bin, total 60 titik data, dengan matriks kovarians penuh.
4.3 Pemetaan Tetap: Mengapa 20 bin RC → 4 bin GGL Penting
P1 menghubungkan 20 bin RC ke 4 bin GGL melalui aturan tetap: setiap bin GGL berkaitan dengan lima bin RC dan dirata-ratakan dengan bobot jumlah galaksi. Pemetaan ini dipertahankan tanpa perubahan untuk setiap model, sehingga menjadi kendala keras bagi uji penutupan maupun perbandingan yang adil.
Mengapa Tidak Menyetel Pemetaan Setelah Fakta Diketahui? |
Jika seseorang dapat memilih setelah fakta bin RC mana yang berkorespondensi dengan bin GGL mana, sebuah model bisa saja membuat penutupan dengan menyusun ulang korespondensi itu. P1 mengunci pemetaan 20→4 sejak awal dan kemudian sengaja memecahnya dengan kontrol negatif pengacakan, tepat untuk menguji apakah sinyal penutupan bergantung pada korespondensi yang secara fisik masuk akal. |
5 | Model dan Metode: Apa Sebenarnya yang Dibandingkan P1?
5.1 Sisi EFT: Respons Gravitasi Rata-rata Berdimensi Rendah
Di sisi EFT, sebuah suku kecepatan tambahan berdimensi rendah digunakan untuk menggambarkan respons gravitasi rata-rata. Bentuk suku tambahan ini dikendalikan oleh fungsi kernel tak berdimensi f(r/ℓ), dengan ℓ sebagai skala global, sementara amplitudonya ditetapkan menurut bin RC. Kernel yang berbeda mewakili kemiringan awal, kecepatan transisi, dan ekor jarak-jauh yang berbeda, lalu digunakan sebagai uji tekanan ketangguhan.
5.2 Sisi DM: Baca Perbandingan Utama dan Lampiran P1A Secara Terpisah
Dalam perbandingan utama, DM_RAZOR adalah garis dasar NFW yang diperkecil dan dapat diaudit: ia memakai relasi c–M tetap, tanpa sebaran antar-halo, kontraksi adiabatik, inti umpan balik, ketakbulatan, atau suku lingkungan. Keunggulannya adalah derajat kebebasan yang terkendali dan reproduksibilitas yang mudah; keterbatasannya adalah ia tidak dapat mewakili semua model LambdaCDM atau semua model halo materi gelap.
Karena itu, Lampiran B (P1A) mengubah sisi DM menjadi seperangkat uji tekanan terstandar. Tanpa mengubah pemetaan bersama atau protokol penutupan, P1A secara bertahap menambahkan cabang penguatan berdimensi rendah seperti SCAT, AC, FB, HIER_CMSCAT, CORE1P, parameter pelensaan m, dan garis dasar gabungan DM_STD, sambil mempertahankan EFT_BIN sebagai kontrol. P1A dapat dibaca begini: alih-alih hanya membandingkan dengan satu garis dasar DM minimal, ia menempatkan beberapa mekanisme DM yang umum dan dapat diaudit dengan kriteria penutupan yang sama.
Rumusan Kesimpulan Akurat yang Dipakai di Sini |
Teks utama: seri EFT secara signifikan melampaui DM_RAZOR minimal dalam perbandingan utama. |
Lampiran B / P1A: di beberapa cabang penguatan DM berdimensi rendah dan dapat diaudit serta uji tekanan DM_STD, sebagian pencocokan gabungan DM membaik, tetapi kekuatan penutupan tidak menghapus keunggulan EFT_BIN. |
Karena itu, rumusan paling aman adalah: dalam batas data, pemetaan, buku besar parameter, dan protokol penutupan P1/P1A, respons gravitasi rata-rata EFT menunjukkan konsistensi lintas-data yang lebih kuat; ini tidak sama dengan mengecualikan semua model materi gelap. |
5.3 Uji Penutupan: Logika Eksperimen P1 yang Paling Penting
1. Lakukan pencocokan hanya dengan RC, lalu peroleh sekumpulan sampel posterior RC-saja.
2. Jangan setel ulang dengan GGL; gunakan posterior RC secara langsung untuk memprediksi GGL.
3. Gunakan kovarians penuh untuk menghitung skor prediksi GGL pada pemetaan yang benar, logL_true.
4. Acak korespondensi bin RC→bin GGL dan hitung skor kontrol negatif, logL_perm.
5. Kurangkan keduanya untuk memperoleh kekuatan penutupan: ΔlogL_closure = <logL_true> − <logL_perm>.
Analogi Sederhana |
Uji penutupan mirip tes ulang lintas-ruang. Sebuah model pertama-tama mempelajari pola di ruang ujian RC, lalu menjawab di ruang ujian GGL. Jika yang dipelajari adalah aturan bersama, bukan trik lokal, ia masih harus berkinerja baik setelah pindah ruangan. Jika korespondensi ruang ujian sengaja dikacaukan, keunggulan itu seharusnya hilang. |
5.4 Sebelum Membaca Tabel Teknis: Empat Titik Masuk
Tabel 5.4 | Rute Membaca untuk Rangkaian Tabel Teknis Berformat Lanskap Berikutnya
Titik Masuk | Apa yang Dilihat | Mengapa Penting |
Tabel S1a | Skor pencocokan gabungan total RC+GGL | Menjawab: di seluruh kedua dataset, penjelasan keseluruhan siapa yang lebih kuat? |
Tabel S1b | Kekuatan penutupan, shuffle, pemindaian ketangguhan | Menjawab: dapatkah apa yang dipelajari RC berpindah ke GGL? |
Tabel B0 | Definisi beberapa cabang penguatan DM dalam P1A | Mencegah P1 direduksi menjadi “hanya dibandingkan dengan DM_RAZOR minimal.” |
Tabel B1 | Papan skor penutupan dan gabungan P1A | Memeriksa apakah keunggulan penutupan menghilang setelah DM diperkuat. |
Catatan Tata Letak |
Halaman berikutnya beralih ke tata letak lanskap untuk mempertahankan tabel lebar dari laporan asli tanpa menghapus kolom atau memampatkannya hingga tidak terbaca. Teks utama sudah memberikan bacaan bahasa sederhana; tabel teknis lanskap ditujukan bagi pembaca yang perlu memverifikasi angka dan cabang model. |
Gbr. 0.1 | Sekilas Alur Kerja Uji Penutupan P1

Catatan: rantai atas adalah “uji penutupan” (cocokkan dengan RC saja → gunakan posterior RC untuk memprediksi GGL); rantai bawah adalah “pencocokan gabungan” (memberi skor RC+GGL bersama-sama). Di sisi kanan, pemetaan benar dibandingkan dengan pemetaan yang diacak untuk memperoleh kekuatan penutupan ΔlogL.
6 | Tabel Teknis Kunci: Tabel Laporan Utama dan Tabel P1A
Tabel S1a | Metrik Perbandingan Pencocokan Gabungan Utama (RC+GGL, Ketat; dipertahankan dari laporan asli)
Model (workspace) | Kernel W | k | Joint logL_total (terbaik) | ΔlogL_total vs DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Tabel S1b | Metrik Penutupan dan Ketangguhan (Ketat; dipertahankan dari laporan asli)
Model (workspace) | Closure ΔlogL (true-perm) | ΔlogL kontrol negatif setelah shuffle | Rentang ΔlogL pemindaian σ_int | Rentang ΔlogL pemindaian R_min | Rentang ΔlogL pemindaian cov-shrink |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
Tabel B0 | Definisi Cabang Penguatan DM dalam P1A (dipertahankan dari Lampiran B laporan asli)
Workspace | model DM | Parameter baru (≤1) | Motivasi fisik (inti) | Prinsip implementasi (ramah audit) |
DM_RAZOR | NFW (fixed c–M, no scatter) | — | Baseline halo LambdaCDM minimal dan dapat diaudit; digunakan untuk perbandingan ketat dengan EFT | Pemetaan bersama tetap; buku besar parameter ketat; digunakan sebagai garis dasar hanya untuk perbandingan relatif |
DM_RAZOR_SCAT | NFW + sebaran c–M (warisan) | σ_logc | Mengizinkan sebaran dalam relasi c–M; didekati dengan sebaran log-normal satu-parameter | ≤1 parameter baru; tetap menggunakan pemetaan bersama; kenaikan penutupan menjadi kriteria penerimaan |
DM_RAZOR_AC | NFW + kontraksi adiabatik (warisan) | α_AC | Jatuhan barionik dapat mendorong kontraksi adiabatik halo; didekati dengan satu parameter kekuatan | ≤1 parameter baru; pemetaan tidak berubah; laporkan perubahan AICc/BIC dan kenaikan penutupan |
DM_RAZOR_FB | NFW + inti umpan balik (warisan) | log r_core | Umpan balik dapat membentuk inti bagian dalam; didekati dengan skala inti satu-parameter | ≤1 parameter baru; protokol penutupan/kontrol negatif sama; peningkatan RC-saja bukan satu-satunya sasaran |
DM_HIER_CMSCAT | Hierarchical c–M scatter + prior | σ_logc (hier) | Bentuk hierarkis yang lebih standar c_i∼logN(c(M_i), σ_logc); memengaruhi posterior gabungan RC dan GGL | Prior eksplisit; c_i laten dimarginalkan; tetap berdimensi rendah dan dapat diaudit |
DM_CORE1P | 1‑parameter core proxy (coreNFW/DC14‑inspired) | log r_core | Menggunakan proksi inti satu-parameter untuk efek utama umpan balik barionik, sehingga menghindari rincian pembentukan bintang berdimensi tinggi | Merujuk literatur standar; ≤1 parameter baru; dikaitkan dengan uji penutupan |
DM_RAZOR_M | NFW + lensing shear‑calibration nuisance | m_shear (GGL) | Menyerap sistematika kunci pelensaan lemah dengan parameter efektif, sehingga mengurangi risiko memperlakukan sistematika sebagai fisika | Nuisance dicatat secara eksplisit dalam buku besar; ia tidak dapat memberi umpan balik ke RC; hasil dinilai terutama dari ketangguhan penutupan |
DM_STD | Standardized DM baseline (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Menempatkan tiga keberatan paling umum ke dalam satu garis dasar terstandar yang tetap berdimensi rendah | Melaporkan buku besar parameter dan kriteria informasi; penutupan adalah metrik utama; dipakai sebagai kontrol pertahanan DM terkuat |
Tabel B1 | Papan Skor P1A (lebih tinggi lebih baik; dipertahankan dari Lampiran B laporan asli)
Cabang model (workspace) | Δk | RC-only best logL_RC (Δ) | Kekuatan penutupan ΔlogL_closure (Δ) | Joint best logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Cara Membaca Tabel B1 (papan skor P1A) |
• Δk: derajat kebebasan baru; lebih besar berarti model lebih kompleks, bukan otomatis lebih baik. • Fokus pada dua kolom: kekuatan penutupan ΔlogL_closure(Δ) (lebih besar berarti konsistensi diri transfer lebih kuat) dan Joint best logL_total(Δ) (skor pencocokan gabungan total). • Nilai dalam tanda kurung (Δ) memberikan selisih relatif terhadap DM_RAZOR untuk perbandingan langsung. |
• Tabel ini terutama bertanya apakah keunggulan penutupan menghilang ketika garis dasar DM diperkuat secara wajar. • Petunjuk membaca: DM_STD meningkatkan skor gabungan secara substansial, tetapi kekuatan penutupannya menurun; EFT_BIN tetap lebih tinggi dalam kekuatan penutupan. |
Ringkasan satu kalimat: dalam kumpulan penguatan DM berdimensi rendah dan dapat diaudit ini, memperbaiki pencocokan gabungan tidak otomatis menghasilkan penutupan yang lebih kuat; penutupan, atau daya alih, tetap menjadi kriteria kunci. |
7 | Bagaimana Hasil Utama Seharusnya Dibaca?
7.1 Pencocokan Gabungan: Pada Kedua Dataset, EFT Mendapat Skor Lebih Tinggi dalam Perbandingan Utama
Tabel S1a dan Gbr. S4 menunjukkan bahwa, dengan data yang sama, pemetaan bersama yang sama, dan skala parameter yang kira-kira sama, seri EFT memiliki ΔlogL_total gabungan sebesar 1155–1337 relatif terhadap DM_RAZOR. Bacaan sederhananya adalah: di bawah satu aturan penskoran yang diterapkan pada RC dan GGL bersama-sama, model-model EFT dalam perbandingan utama memperoleh skor total yang lebih tinggi.
7.2 Uji Penutupan: Penekanan Utama P1 adalah Daya Alih
Kekuatan penutupan yang tinggi berarti parameter yang disimpulkan dari RC saja dapat memprediksi GGL dengan lebih baik tanpa melihat GGL lagi. Dalam laporan P1, ΔlogL_closure EFT adalah 172–281, sedangkan DM_RAZOR adalah 127. Hal ini lebih penting daripada sekadar mengatakan bahwa tiap model cocok dengan datanya sendiri, karena ia membatasi kebebasan model pada dataset kedua.
7.3 Kontrol Negatif: Mengapa “Runtuhnya Sinyal” Justru Baik?
Setelah P1 mengacak korespondensi pengelompokan bin RC→bin GGL, sinyal penutupan EFT turun ke rentang 6–23. Bagi pembaca umum, langkah ini adalah pemeriksaan anti-curang: jika keunggulan penutupan hanya merupakan produk samping kode, satuan, penanganan kovarians, atau keberuntungan pencocokan, korespondensi yang diacak mungkin masih menunjukkan keunggulan. Sebaliknya, keunggulan itu runtuh, yang menunjukkan bahwa ia bergantung pada pemetaan yang benar.

Gbr. S3 | Kekuatan penutupan (lebih tinggi lebih baik): keunggulan log-likelihood rata-rata untuk prediksi RC-saja → GGL.
Cara Membaca Gambar Ini |
Gambar ini sentral bagi P1. Semakin tinggi batang, semakin baik informasi yang dipelajari dari RC berpindah ke GGL. |
Seri EFT secara keseluruhan lebih tinggi daripada DM_RAZOR, yang menunjukkan penutupan lintas-probe lebih kuat dalam eksperimen “pelajari RC dulu, lalu prediksi GGL”. |

Gbr. S4 | Keunggulan pencocokan gabungan (lebih tinggi lebih baik): logL_total terbaik RC+GGL relatif terhadap DM_RAZOR.
Cara Membaca Gambar Ini |
Gambar ini menunjukkan skor total setelah RC dan GGL dicocokkan secara gabungan. |
Semua varian EFT berada jauh di atas nol, menunjukkan bahwa keunggulan EFT dalam perbandingan utama bukan efek lokal satu titik, melainkan perilaku keseluruhan analisis gabungan. |

Gbr. R1 | Kontrol negatif: sinyal penutupan turun tajam setelah pengelompokan diacak.
Cara Membaca Gambar Ini |
Gambar ini menunjukkan bahwa ketika relasi binning RC↔GGL yang benar diacak, sinyal penutupan turun tajam. |
Ini membuat hasil P1 tampak lebih seperti konsistensi nyata di sepanjang pemetaan data, bukan kebetulan numerik yang dapat diperoleh di bawah pemetaan apa pun. |
8 | Ketangguhan dan Kontrol: Bagaimana P1 Menghindari Kesan Sekadar Penyetelan Parameter
Pertanyaan paling alami untuk laporan teknis apa pun adalah: apakah keunggulan itu berasal dari satu setelan derau, satu segmen data wilayah pusat, satu perlakuan kovariansi, atau pemfitan berlebih? P1 menjawabnya dengan beberapa uji tekanan.
Tabel 2 | Cara Membaca Uji Ketangguhan dan Kontrol Negatif P1
Uji | Pertanyaan yang Hendak Disingkirkan | Bacaan |
Pemindaian σ_int | Jika RC mengandung sebaran tambahan yang belum diketahui, apakah kesimpulannya tetap stabil? | Setelah galat RC dilonggarkan, peringkat EFT dan skala keunggulannya tetap stabil. |
Pemindaian R_min | Jika wilayah pusat galaksi tidak sepenuhnya dipercaya, apakah kesimpulannya tetap stabil? | Setelah wilayah pusat dipotong, EFT masih mempertahankan keunggulan positif. |
Pemindaian cov-shrink | Jika estimasi kovarians GGL tidak pasti, apakah kesimpulannya tetap stabil? | Setelah kovarians disusutkan ke arah diagonal, keunggulan tidak sensitif. |
Tangga ablasi | Apakah EFT memperoleh keunggulan dari kompleksitas yang tidak perlu? | EFT_BIN penuh diperlukan menurut kriteria informasi. |
Prediksi tertahan LOO | Apakah model hanya menjelaskan data yang sudah dilihatnya? | Bin GGL yang ditahan masih menunjukkan generalisasi yang relatif kuat. |
Shuffle bin RC | Apakah penutupan berasal dari pemetaan yang benar? | Penutupan turun setelah pengelompokan diacak, mendukung ketergantungan pada pemetaan. |

Gbr. R2 | Rentang ΔlogL_total pada pemindaian σ_int (lebih tinggi lebih baik).
Cara Membaca Gambar Ini |
Memeriksa apakah keunggulan EFT tetap bertahan setelah mengubah asumsi sebaran intrinsik RC. |

Gbr. R3 | Rentang ΔlogL_total pada pemindaian R_min (lebih tinggi lebih baik).
Cara Membaca Gambar Ini |
Memeriksa apakah keunggulan EFT tetap stabil setelah memangkas wilayah pusat yang kompleks. |

Gbr. R4 | Rentang ΔlogL_total pada pemindaian cov-shrink (lebih tinggi lebih baik).
Cara Membaca Gambar Ini |
Memeriksa apakah peringkat sensitif terhadap perubahan penanganan kovarians pelensaan lemah. |

Gbr. R5 | Tangga ablasi untuk EFT_BIN (AICc; lebih rendah lebih baik).
Cara Membaca Gambar Ini |
Memeriksa apakah EFT_BIN penuh diperlukan untuk menjelaskan data, bukan sekadar menambah parameter. |

Gbr. R6 | LOO: distribusi log-likelihood untuk bin yang ditahan.
Cara Membaca Gambar Ini |
Memeriksa apakah model masih memprediksi bin GGL yang belum pernah dilihatnya. |

Gbr. R7 | Kontrol negatif: pemetaan yang diacak menghasilkan penurunan jelas pada rerata logL_true penutupan.
Cara Membaca Gambar Ini |
Lebih lanjut menunjukkan, dari perspektif rerata logL_true, bahwa penutupan bergantung pada pemetaan lintas-data yang benar. |
9 | P1A: Mengapa “Banyak Model DM di Lampiran” Penting
Bagian ini tidak bertanya, “Apakah EFT hanya mengalahkan satu DM_RAZOR minimal?” Ia bertanya apakah kesimpulan uji penutupan dan pencocokan gabungan berubah ketika garis dasar DM diperkuat dalam pengaturan yang berdimensi rendah, dapat direproduksi, dan memiliki buku besar parameter yang jelas (P1A). Dengan kata lain, P1A mengurangi kritik bahwa perbandingan memilih garis dasar DM yang terlalu lemah, lalu memindahkan diskusi ke pertanyaan apakah kinerja penutupan tetap berbeda di bawah seperangkat penguatan DM yang dapat diaudit.
P1A tidak berusaha menghabiskan semua kemungkinan model halo LambdaCDM, dan juga tidak mengubah sisi DM menjadi mesin pencocok berdimensi tinggi yang sulit diaudit. Ia memilih penguatan berdimensi rendah yang dapat direproduksi dengan buku besar parameter yang jelas: sebaran konsentrasi, kontraksi adiabatik, inti umpan balik, prior sebaran hierarkis c–M, proksi inti satu-parameter, parameter gangguan kalibrasi shear pelensaan lemah, dan cabang gabungan DM_STD.
Bacaan Utama P1A |
Di antara tiga cabang warisan, hanya inti umpan balik yang menghasilkan kenaikan bersih kecil dalam kekuatan penutupan; SCAT dan AC tidak menghasilkan kenaikan penutupan bersih. |
DM_HIER_CMSCAT, DM_RAZOR_M, dan DM_CORE1P hanya berdampak kecil pada kekuatan penutupan atau tidak menunjukkan kenaikan bersih yang signifikan. |
DM_STD dapat meningkatkan logL gabungan secara substansial, tetapi kekuatan penutupannya menurun, yang mengisyaratkan bahwa ia terutama meningkatkan fleksibilitas pencocokan gabungan, bukan daya prediksi-transfer RC→GGL. |
Dalam Tabel B1 P1A, EFT_BIN masih mempertahankan kekuatan penutupan yang lebih tinggi dan keunggulan pencocokan gabungan. Karena itu, klaim inti P1 tidak boleh disederhanakan menjadi “ia hanya mengalahkan DM_RAZOR minimal.” |

Gambar B1 | Papan skor P1A: penutupan dan ΔlogL gabungan relatif terhadap garis dasar (lebih tinggi lebih baik).
Cara Membaca Gambar Ini |
Gambar ini menunjukkan kinerja beberapa cabang penguatan DM relatif terhadap garis dasar. |
Maknanya bukan “semua DM tersingkir.” Gambar ini menunjukkan bahwa dalam penguatan DM berdimensi rendah dan dapat diaudit yang dipilih di P1A, memperkuat DM tidak menghapus keunggulan penutupan EFT_BIN. |
10 | Mengapa Eksperimen P1 Layak Dilakukan
10.1 Signifikansi Metodologis: Letakkan Penutupan Lintas-Probe di Atas Pencocokan Satu-Probe
Teori skala galaksi mudah tersangkut pada pertanyaan apakah model tertentu dapat mencocokkan satu kumpulan kurva rotasi. P1 menaikkan ambang: dapatkah parameter yang dipelajari dari RC memprediksi pelensaan lemah tanpa disetel ulang pada GGL? Ini mengubah P1 dari kontes pencocokan menjadi uji prediksi-transfer.
10.2 Signifikansi Transparansi: Perlakukan Rantai Reproduksibel sebagai Bagian dari Hasil
Salah satu kontribusi penting P1 adalah bahwa ia merilis data, tabel dan gambar, label run, kontrol negatif, paket reproduksi, dan rantai audit secara bersama-sama. Ini penting baik bagi pendukung maupun pengkritik: diskusi dapat kembali ke data publik yang sama, pemetaan yang sama, skrip yang sama, dan metrik yang sama, alih-alih membandingkan slogan.
10.3 Signifikansi Fisik: Uji Tekanan Kuat untuk Gravitasi Non-Materi-Gelap
Dalam gravitasi non-materi-gelap, banyak model dapat menjelaskan sebagian fenomenologi kurva rotasi atau RAR. Tugas yang lebih sulit adalah lolos dari pembacaan pelensaan lemah pada saat yang sama dan menunjukkan, melalui kontrol negatif, bahwa sinyal bergantung pada pemetaan yang benar. Signifikansi P1 adalah bahwa ia menempatkan respons gravitasi rata-rata EFT di dalam protokol yang menyerupai ujian eksternal: RC menjadi medan latihan, GGL menjadi medan transfer, dan pengacakan menjadi medan anti-curang.
10.4 Apakah Ini Eksperimen Penting bagi Gravitasi Non-Materi-Gelap?
Jawaban yang hati-hati adalah ini: jika penanganan data P1, paket reproduksi, dan protokol penutupannya bertahan di bawah telaah eksternal, ia dapat diperlakukan sebagai eksperimen penutupan RC+GGL yang patut dianggap serius dalam riset gravitasi non-materi-gelap / gravitasi termodifikasi. Kepentingannya bukan klaim bahwa ia “menumbangkan materi gelap,” melainkan fakta bahwa ia menawarkan kriteria lintas-probe yang dapat direproduksi, digugat, dan diperluas.
Apakah Sudah Ada Kerangka Penutupan Prediktif RC+GGL yang Sama Kuat? |
Kerangka dan tradisi pengamatan yang relevan sudah ada. MOND/RAR menata banyak fenomena kurva rotasi dengan baik; karya RAR pelensaan lemah KiDS-1000 juga membandingkan MOND, emergent gravity Verlinde, dan model LambdaCDM. LambdaCDM juga dapat menjelaskan sebagian fenomenologi pelensaan lemah/dinamika melalui koneksi galaksi–halo, halo gas, dan pemodelan umpan balik. |
Namun klaim tepat P1 bukan bahwa tidak ada kerangka lain yang dapat menjelaskan RC+GGL. Klaimnya adalah bahwa di bawah pemetaan tetap publik P1 sendiri, penutupan RC-saja→GGL, kontrol negatif pengacakan, buku besar parameter, dan protokol uji tekanan multi-DM P1A, EFT melaporkan kinerja penutupan yang lebih kuat. |
Dengan kata lain, hal yang paling layak diuji secara eksternal dari P1 adalah protokol perbandingannya yang konkret dan dapat direproduksi. Langkah berikut yang sangat bernilai adalah menguji apakah MOND/RAR, LambdaCDM/HOD, simulasi hidrodinamika, atau kerangka gravitasi termodifikasi lain dapat mencapai skor penutupan yang setara atau lebih tinggi di bawah protokol yang sama. |
11 | Apa yang Dapat Disimpulkan P1, dan Apa yang Tidak Dapat Disimpulkan?
Tabel 3 | Batas-Batas Kesimpulan P1
Dapat disimpulkan | Di bawah data RC+GGL P1, pemetaan tetap, dan protokol perbandingan utama, seri EFT memiliki kekuatan pencocokan gabungan dan penutupan yang lebih tinggi daripada DM_RAZOR minimal. |
Dapat disimpulkan | Dalam rentang penguatan DM P1A yang berdimensi rendah dan dapat diaudit, beberapa penguatan DM tidak menghapus keunggulan penutupan EFT_BIN. |
Dapat disimpulkan | Kontrol negatif shuffle menunjukkan bahwa sinyal penutupan bergantung pada pemetaan lintas-data yang benar dan tidak dapat diperoleh dari pemetaan sembarang. |
Tidak dapat disimpulkan | P1 tidak menumbangkan semua model materi gelap. P1A masih belum menghabiskan ketakbulatan, ketergantungan lingkungan, koneksi galaksi–halo yang kompleks, umpan balik berdimensi tinggi, atau simulasi kosmologis penuh. |
Tidak dapat disimpulkan | P1 tidak membuktikan teori EFT lengkap dari prinsip pertama. Ia hanya menguji lapisan fenomenologis respons gravitasi rata-rata. |
Tidak dapat disimpulkan | P1 tidak menyingkirkan semua sistematika. Ia hanya memberikan bukti ketangguhan dalam uji tekanan dan ruang lingkup audit yang tercantum. |
12 | Pertanyaan yang Sering Diajukan untuk Pembaca Umum
T1: Apakah ini berarti “materi gelap tidak ada”?
Tidak. Kesimpulan P1 harus dibatasi pada data, protokol, dan model perbandingan yang digunakan di sini. P1A melampaui garis dasar minimal DM_RAZOR, tetapi tetap tidak mewakili setiap kemungkinan model materi gelap.
T2: Apakah ini berarti “EFT telah terbukti”?
Juga tidak. P1 menguji EFT sebagai parameterisasi respons gravitasi rata-rata dan menunjukkan kinerja penutupan RC→GGL yang lebih kuat. Mekanisme mikroskopik dan teori lengkap bukanlah kesimpulan P1.
T3: Mengapa tidak langsung menyatakan nilai signifikansi dalam σ?
P1 menggunakan skor likelihood terpadu, kriteria informasi, dan selisih penutupan. ΔlogL adalah keunggulan relatif di bawah aturan penskoran yang sama; ia tidak sama dengan satu nilai σ tunggal.
T4: Mengapa pemetaan bin RC→bin GGL diacak?
Itu adalah kontrol negatif. Sinyal lintas-probe yang sejati seharusnya bergantung pada pemetaan yang benar. Jika sinyal tetap sama kuat setelah diacak, itu justru akan mengisyaratkan bias implementasi atau artefak statistik.
T5: Apa langkah P1 berikutnya?
Perluas protokol yang sama ke lebih banyak data, lebih banyak kontrol DM, sistematika yang lebih kompleks, dan lebih banyak kerangka gravitasi termodifikasi—terutama dalam bentuk yang memungkinkan tim eksternal mengujinya ulang di bawah metrik penutupan yang sama.
13 | Glosarium Mini
Tabel 4 | Glosarium Mini
Istilah | Penjelasan Satu Kalimat |
Kurva rotasi (RC) | Relasi radius–kecepatan dalam piringan galaksi, digunakan untuk menyimpulkan gravitasi efektif di dalam bidang piringan. |
Pelensaan lemah (GGL) | Mengukur distribusi gravitasi/massa rata-rata di sekitar galaksi latar-depan melalui distorsi statistik pada bentuk galaksi latar-belakang. |
Uji penutupan | Menggunakan posterior RC untuk memprediksi GGL, lalu membandingkannya dengan kontrol negatif pemetaan yang diacak. |
Kontrol negatif | Dengan sengaja memutus struktur kunci untuk melihat apakah sinyal menghilang; digunakan untuk menyingkirkan sinyal palsu. |
Halo NFW | Profil kerapatan halo materi gelap yang umum digunakan dalam model materi gelap dingin. |
Relasi c–M | Relasi antara konsentrasi halo c dan massa M; mengizinkan sebaran memengaruhi fleksibilitas model. |
DM_STD | Cabang uji tekanan DM terstandar dalam P1A yang menggabungkan beberapa penguatan DM berdimensi rendah dengan satu parameter gangguan pelensaan. |
ΔlogL | Selisih log-likelihood antara dua model di bawah aturan penskoran yang sama; nilai positif berarti model pertama berkinerja lebih baik. |
Kovariansi | Deskripsi matriks tentang korelasi di antara titik-titik data; data pelensaan lemah biasanya membutuhkan matriks kovarians penuh. |
14 | Rute Bacaan yang Disarankan dan Titik Masuk Sitasi
1. Baca Bagian 0–2 terlebih dahulu untuk memahami pertanyaan P1 dan peran EFT yang dibatasi di dalam P1.
2. Lalu baca Gbr. S3, Gbr. S4, serta Tabel S1a/S1b untuk memahami kekuatan penutupan, pencocokan gabungan, dan kontrol negatif.
3. Jika Anda khawatir garis dasar DM terlalu lemah, langsung buka Bagian 9 dan Tabel B1 / Gambar B1.
4. Untuk tinjauan teknis, kembali ke laporan teknis P1 v1.1, Suplemen Tabel & Gambar, dan full_fit_runpack.
Titik Masuk Arsip Utama |
Laporan teknis P1 (tingkat rilis, Concept DOI): 10.5281/zenodo.18526334 |
Paket reproduksi penuh P1 (Concept DOI): 10.5281/zenodo.18526286 |
Basis pengetahuan terstruktur EFT (opsional, Concept DOI): 10.5281/zenodo.18853200 |
Catatan lisensi: laporan teknis menggunakan CC BY-NC-ND 4.0; paket reproduksi penuh menggunakan CC BY 4.0 (tunduk pada laporan teknis dan catatan arsip Zenodo). |
15 | Referensi dan Latar Belakang Eksternal
McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.
Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.
Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.
Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.
Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.
Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.