Penjelasan Laporan P1

Dari Kurva Rotasi ke Pelensaan Lemah: Menguji Respons Gravitasi Rata-Rata EFT

Panduan untuk publik berdasarkan P1_RC_GGL: Uji Penutupan Ketat atas Dinamika Galaksi dan Pelensaan Lemah (v1.1)

Laporan asli oleh Guanglin Tu | Dasar versi: P1 v1.1 | Status editorial: draf penjelasan publik / bukan makalah tinjauan sejawat
Arsip terkait: DOI laporan 10.5281/zenodo.18526334 | DOI paket reproduksi 10.5281/zenodo.18526286

Simak laporan evaluasi asli:

1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc

2. Gemini: https://gemini.google.com/share/773ec96d75a0

3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04

4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46

5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm

6. Doubao: https://www.doubao.com/thread/w166b207d7345e46a

Catatan Baca

Ini adalah versi penjelasan, bukan laporan akademik terpisah. Dokumen ini didasarkan pada laporan P1 asli, mempertahankan gambar dan tabel kunci, serta menambahkan penjelasan bahasa umum tentang arti setiap langkah utama.

Panduan ini hanya menjelaskan kesimpulan P1 di bawah set data, buku besar parameter, dan protokol statistik yang telah ditetapkannya: dalam uji gabungan kurva rotasi galaksi (RC) dan pelensaan lemah galaksi–galaksi (GGL), model respons gravitasi rata-rata EFT jelas mengungguli baseline minimal DM_RAZOR yang diuji di sini.

Panduan ini tidak menafsirkan P1 sebagai klaim bahwa “materi gelap telah ditumbangkan.” P1 hanyalah langkah pertama dalam eksperimen seri P. Ia menguji satu lapisan EFT yang dapat diamati—“dasar gravitasi rata-rata”—bukan seluruh isi kerangka EFT lengkap.

0 | Memahami P1 dalam Lima Menit: Apa yang Sebenarnya Diuji?

Bayangkan P1 sebagai uji konsistensi lintas-probe. Uji ini tidak hanya bertanya apakah suatu model dapat mencocokkan satu set data. Sebaliknya, P1 menempatkan dua pembacaan gravitasi yang sangat berbeda di bangku audit yang sama: kurva rotasi (RC) membaca dinamika di dalam piringan galaksi, sedangkan pelensaan lemah galaksi-galaksi (GGL) membaca respons gravitasi terproyeksi pada skala yang lebih besar.

RC ibarat speedometer: ia memberi tahu seberapa cepat gas dan bintang berputar pada berbagai radius di piringan galaksi.
GGL ibarat timbangan: dengan mengukur bagaimana galaksi latar depan sedikit membengkokkan cahaya dari galaksi latar belakang, ia menyimpulkan distribusi gravitasi/massa rata-rata di sekitar galaksi pada skala yang lebih besar.
Pertanyaan inti P1 adalah: dapatkah model yang sama terlebih dahulu belajar pola dari RC, lalu memindahkan pola itu ke GGL dan tetap masuk akal?

P1 dalam Satu Kalimat

P1 menaikkan ambang perbandingan dari “apakah ia cocok dengan satu probe?” menjadi “apakah ia menutup lintas-probe?” Suatu model lebih mungkin menangkap struktur gravitasi yang dibagi RC dan GGL hanya jika ia berkinerja baik di bawah pemetaan yang benar dan sinyalnya runtuh setelah pemetaan diacak.

Tabel 0 | Angka Inti P1 dan Cara Membacanya

Metrik	Pembacaan dalam P1 / P1A	Makna Bahasa Umum
Pencocokan gabungan ΔlogL_total	Dalam perbandingan utama teks, EFT berada 1155–1337 di atas DM_RAZOR	Selisih skor total di dua set data; semakin besar berarti penjelasan keseluruhan lebih baik.
Kekuatan penutupan ΔlogL_closure	Dalam perbandingan utama teks, EFT berada pada 172–281, sedangkan DM_RAZOR 127	Kemampuan memprediksi GGL setelah inferensi hanya dari RC; semakin besar berarti konsistensi mandiri lintas-probe lebih kuat.
Shuffle kontrol negatif	Setelah RC-bin→GGL-bin diacak, sinyal penutupan EFT turun menjadi 6–23	Jika korespondensi yang benar dirusak, keunggulan seharusnya hilang; semakin tajam keruntuhannya, semakin baik ia menyingkirkan sinyal palsu.
Uji tekanan multi-DM P1A	DM 7+1 + DM_STD, dengan EFT_BIN tetap sebagai pembanding	P1A tidak hanya melihat baseline minimal DM_RAZOR. Ia menempatkan beberapa cabang penguatan DM yang berdimensi rendah dan dapat diaudit ke dalam protokol penutupan yang sama.

1 | Mengapa P1 Perlu Dilakukan? Di Mana Kosmologi Skala Galaksi Tersendat?

Masalah pada skala galaksi tetap sulit karena “kebutuhan gravitasi/massa tambahan” bukan hanya fenomena kurva rotasi. Banyak pengamatan menunjukkan hubungan yang ketat antara materi barionik yang terlihat di galaksi dan pembacaan dinamika/pelensaan yang sebenarnya. Bagi jalur materi gelap, ini berarti halo gelap, umpan balik barionik, riwayat pembentukan galaksi, dan galat sistematik pengamatan harus dikoordinasikan dengan sangat halus. Bagi jalur gravitasi non-materi-gelap, ini berarti model tidak boleh hanya terlihat bagus pada RC, tetapi juga harus tetap berlaku pada pelensaan lemah, hukum skala populasi, dan kontrol negatif.

Itulah motivasi P1. Uji ini tidak berangkat dari “materi gelap salah” atau “EFT pasti benar.” P1 membawa satu klaim yang dapat diuji ke meja audit: apakah respons gravitasi rata-rata dalam EFT dapat meninggalkan sinyal yang dapat direproduksi dan dipindahkan dalam penutupan lintas-probe RC→GGL.

Konteks Literatur Eksternal: Mengapa Jendela RC+GGL Penting

Radial acceleration relation (RAR) yang diajukan McGaugh, Lelli, dan Schombert pada 2016 menunjukkan korelasi ketat dengan scatter rendah antara percepatan teramati yang dilacak kurva rotasi dan percepatan yang diprediksi dari materi barionik. Ini membuat “penggandengan barion–respons gravitasi” menjadi hal yang tidak dapat dihindari bagi teori skala galaksi.

Brouwer et al. (2021) menggunakan pelensaan lemah KiDS-1000 untuk memperluas RAR ke percepatan yang lebih rendah dan radius yang lebih besar, sambil membandingkan MOND, gravitasi emergen Verlinde, dan model LambdaCDM. Mereka juga mencatat bahwa perbedaan antara galaksi tipe awal dan tipe akhir, halo gas, serta koneksi galaksi–halo tetap menjadi isu penjelasan kunci.

Mistele et al. (2024) selanjutnya menggunakan pelensaan lemah untuk menyimpulkan kurva kecepatan sirkular galaksi terisolasi, dan melaporkan tidak adanya penurunan jelas hingga beberapa ratus kpc bahkan kira-kira 1 Mpc, selaras dengan BTFR. Ini menunjukkan bahwa pelensaan lemah sedang menjadi pembacaan eksternal penting untuk menguji respons gravitasi skala galaksi.

Karena itu, nilai P1 bukanlah bahwa ia “pertama kali membahas RC dan GGL bersama-sama.” Nilainya terletak pada penempatan keduanya dalam sebuah protokol yang dapat diaudit: pemetaan tetap, buku besar parameter, penutupan RC-only→GGL, kontrol negatif shuffle, dan uji tekanan multi-DM P1A.

2 | Apa Arti EFT dalam P1? Ini Bukan Effective Field Theory

Di sini, EFT merujuk pada Teori filamen energi (Energy Filament Theory, EFT), bukan Effective Field Theory yang lazim digunakan dalam fisika. Dalam laporan teknis P1, EFT digunakan secara sangat terkendali: ia tidak masuk ke perbandingan sebagai teori final yang lengkap, melainkan terlebih dahulu dipadatkan menjadi parameterisasi “respons gravitasi rata-rata” yang dapat diamati, dicocokkan, dan dibantah.

Dengan bahasa sederhana, P1 tidak mulai dengan membahas semua sumber mikroskopis gravitasi tambahan, dan tidak berusaha membuktikan seluruh kerangka EFT sekaligus. Ia mengajukan pertanyaan yang lebih sempit dan lebih keras: jika pada skala galaksi ada sejenis respons gravitasi tambahan rata-rata, dapatkah respons itu lebih dahulu menjelaskan RC, lalu bermigrasi untuk memprediksi GGL?

Bagian EFT Mana yang Diuji P1?

P1 menargetkan “dasar gravitasi rata-rata”: kontribusi rata-rata yang stabil secara statistik dan dapat dipindahkan lintas sampel.

P1 belum menangani “dasar stokastik/kebisingan”: suku acak, perbedaan individual, atau scatter tambahan yang mungkin diperkenalkan oleh proses fluktuasi yang lebih mikroskopis.

P1 juga tidak membahas mekanisme mikroskopis lengkap, kelimpahan, masa hidup, atau kendala kosmologis global. Ini adalah langkah pertama dalam eksperimen seri P, bukan vonis akhir.

3 | Rencana Seri P1: Mengapa Dimulai dari “Dasar Rata-Rata”?

Seri P dapat dipahami sebagai program pencarian observasional EFT. Ia tidak membentangkan semua klaim sekaligus; sebaliknya, ia mengisolasi bagian yang paling mudah diuji dengan data publik. Strategi P1 adalah menguji komponen rata-rata terlebih dahulu: jika respons gravitasi rata-rata bahkan tidak dapat menutup dari RC ke GGL, maka pembahasan tentang komponen kebisingan yang lebih rumit atau mekanisme mikroskopis kehilangan pintu masuknya.

Tabel 1 | Posisi Berlapis Seri P

Lapisan	Pertanyaan yang Diajukan	Peran dalam P1
P1	Dapatkah respons gravitasi rata-rata menutup dalam RC→GGL?	Pertanyaan utama laporan saat ini
P1A	Jika sisi DM diperkuat, apakah kesimpulan tetap stabil?	Lampiran B: uji tekanan DM 7+1 + DM_STD
Pekerjaan seri P berikutnya	Dapatkah protokol diperluas ke lebih banyak data, probe, dan sistematika yang lebih kompleks?	Arah kerja mendatang
Pertanyaan tingkat lebih dalam	Bagaimana suku rata-rata, suku kebisingan, dan mekanisme mikroskopis terhubung?	Di luar cakupan kesimpulan P1

4 | Apa Datanya? Apa yang Diceritakan RC dan GGL?

4.1 Kurva Rotasi (RC): “Pengukur Kecepatan” di Dalam Piringan Galaksi

Kurva rotasi mencatat seberapa cepat gas dan bintang mengorbit pusat galaksi pada berbagai radius. Semakin cepat rotasinya, semakin kuat gaya sentripetal yang dibutuhkan pada radius tersebut—dan karenanya semakin kuat gravitasi efektifnya. P1 menggunakan basis data SPARC; setelah prapemrosesan, 104 galaksi dengan 2.295 titik data kecepatan dimasukkan dan dibagi menjadi 20 RC-bin.

4.2 Pelensaan Lemah (GGL): “Timbangan Gravitasi” pada Skala yang Lebih Besar

Pelensaan lemah galaksi–galaksi mengukur bagaimana galaksi latar depan sedikit membengkokkan cahaya dari galaksi latar belakang. Ini berkaitan dengan respons gravitasi terproyeksi pada radius yang lebih besar, setara skala halo, dan tidak bergantung pada rincian dinamika gas galaksi. P1 menggunakan data GGL publik KiDS-1000 / Brouwer et al. 2021: 4 bin massa bintang, masing-masing dengan 15 titik radius, total 60 titik data, dan menggunakan kovarians lengkap.

4.3 Pemetaan Tetap: Mengapa 20 RC-bin → 4 GGL-bin Itu Penting

P1 menghubungkan 20 RC-bin dengan 4 GGL-bin melalui aturan tetap: setiap GGL-bin berkorespondensi dengan 5 RC-bin, lalu digabungkan dengan rata-rata berbobot jumlah galaksi. Pemetaan ini dipertahankan sama untuk semua model dan menjadi batas keras bagi uji penutupan serta perbandingan yang adil.

Mengapa Tidak Menyetel Pemetaan Setelahnya?

Jika setelah melihat hasil seseorang dapat memilih “RC-bin mana yang berkorespondensi dengan GGL-bin mana,” model bisa saja membuat penutupan secara buatan dengan mengatur ulang korespondensi. P1 mengunci pemetaan 20→4 sejak awal dan sengaja merusaknya dengan kontrol negatif shuffle, tepat untuk menilai apakah sinyal penutupan benar-benar bergantung pada korespondensi yang masuk akal secara fisik.

5 | Model dan Metode: Apa Sebenarnya yang Dibandingkan P1?

5.1 Sisi EFT: Respons Gravitasi Rata-Rata Berdimensi Rendah

Di sisi EFT, sebuah suku kecepatan tambahan berdimensi rendah digunakan untuk menggambarkan respons gravitasi rata-rata. Bentuk suku tambahan ini dikendalikan oleh fungsi kernel tak berdimensi f(r/ℓ), dengan ℓ sebagai skala global, sementara amplitudonya diberikan menurut RC-bin. Fungsi kernel yang berbeda mewakili kemiringan awal, kecepatan transisi, dan ekor jarak-jauh yang berbeda; semuanya dipakai untuk uji tekanan ketangguhan.

5.2 Sisi DM: Perbandingan Utama dalam Teks dan Lampiran P1A Harus Dibaca Terpisah

Dalam perbandingan utama di teks, DM_RAZOR adalah baseline NFW yang diminimalkan dan dapat diaudit: ia menggunakan hubungan c–M tetap dan tidak memasukkan scatter halo-ke-halo, kontraksi adiabatik, core akibat umpan balik, ketidaksferisan, maupun komponen lingkungan. Kelebihan rancangan ini adalah derajat bebasnya terkendali dan mudah direproduksi; kekurangannya, ia tidak mewakili seluruh LambdaCDM atau semua model halo materi gelap.

Karena itu, dalam Lampiran B (P1A), sisi DM diubah menjadi serangkaian “uji tekanan terstandar.” Tanpa mengubah pemetaan bersama atau protokol penutupan, P1A secara bertahap menambahkan cabang penguatan berdimensi rendah seperti SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m, serta baseline gabungan DM_STD, sambil mempertahankan EFT_BIN sebagai pembanding. P1A dapat dipahami begini: bukan hanya membandingkan dengan satu baseline DM minimal, melainkan memasukkan serangkaian mekanisme DM yang umum dan dapat diaudit ke dalam satu “penggaris penutupan” yang sama.

Pembingkaian Kesimpulan yang Tepat dalam Dokumen Ini

Teks utama: keluarga EFT secara substansial mengungguli DM_RAZOR minimal dalam perbandingan utama.

Lampiran B / P1A: di bawah beberapa cabang penguatan DM yang berdimensi rendah dan dapat diaudit serta uji tekanan DM_STD, sebagian pencocokan gabungan DM membaik, tetapi kekuatan penutupan tidak menghapus keunggulan EFT_BIN.

Karena itu, pernyataan paling aman adalah: dalam cakupan data, pemetaan, buku besar parameter, dan protokol penutupan P1/P1A, respons gravitasi rata-rata EFT menunjukkan konsistensi lintas-data yang lebih kuat; ini tidak sama dengan mengecualikan semua model materi gelap.

5.3 Uji Penutupan: Sintaks Eksperimental Terpenting P1

1. Lakukan pencocokan hanya dengan RC untuk memperoleh sekumpulan sampel posterior RC-only.

2. Jangan menyetel ulang dengan GGL; gunakan posterior RC secara langsung untuk memprediksi GGL.

3. Gunakan kovarians lengkap untuk menghitung skor prediksi GGL di bawah pemetaan yang benar, logL_true.

4. Acak korespondensi RC-bin→GGL-bin untuk menghitung skor kontrol negatif, logL_perm.

5. Kurangi keduanya untuk memperoleh kekuatan penutupan: ΔlogL_closure = <logL_true> − <logL_perm>.

Analogi Bahasa Umum

Uji penutupan seperti ujian ulang lintas-ruang. Model pertama-tama belajar pola di ruang ujian RC, lalu menjawab di ruang ujian GGL. Jika yang dipelajari adalah aturan bersama, bukan trik lokal, ia tetap harus menjawab dengan baik setelah pindah ruang; jika korespondensi antarruang ujian sengaja diacak, keunggulannya harus menghilang.

5.4 Sebelum Membaca Tabel Teknis: Empat Pintu Masuk

Tabel 5.4 | Jalur Baca untuk Kumpulan Tabel Teknis Mendatar Berikutnya

Pintu Masuk	Apa yang Dilihat	Mengapa Penting
Tabel S1a	Skor total pencocokan gabungan RC+GGL	Menjawab: “Ketika dua set data dilihat bersama, penjelasan keseluruhan siapa yang lebih kuat?”
Tabel S1b	Kekuatan penutupan, shuffle, dan pemindaian ketangguhan	Menjawab: “Dapatkah hal yang dipelajari dari RC berpindah ke GGL?”
Tabel B0	Definisi beberapa cabang penguatan DM dalam P1A	Mencegah P1 direduksi menjadi “hanya perbandingan dengan DM_RAZOR minimal.”
Tabel B1	Scoreboard penutupan dan pencocokan gabungan P1A	Memeriksa apakah keunggulan penutupan hilang setelah DM diperkuat.

Catatan Tata Letak

Halaman lanskap dimulai pada halaman berikutnya agar tabel lebar dari laporan asli dapat dipertahankan utuh tanpa menghapus kolom atau memampatkannya hingga tidak terbaca. Teks utama sudah memberikan pembacaan bahasa umum; tabel teknis lanskap ditujukan bagi pembaca yang perlu memverifikasi nilai dan cabang model.

Gambar 0.1 | Alur Kerja Uji Penutupan P1 dalam Satu Diagram

Catatan: rantai bagian atas adalah “uji penutupan” (cocokkan hanya RC → gunakan posterior RC untuk memprediksi GGL); rantai bagian bawah adalah “pencocokan gabungan” (skor RC+GGL secara bersama). Di sisi kanan, pemetaan benar dibandingkan dengan pemetaan yang diacak untuk memperoleh kekuatan penutupan ΔlogL.

6 | Tabel Teknis Kunci: Tabel Utama dari Laporan Asli dan Tabel P1A

Tabel S1a | Metrik Perbandingan Utama Pencocokan Gabungan (RC+GGL, Strict; dipertahankan dari laporan asli)

Model (workspace)	Kernel W	k	Joint logL_total (best)	ΔlogL_total vs DM	AICc	BIC
DM_RAZOR	none	20	-16927.763	0.0	33895.885	34010.811
EFT_BIN	none	21	-15590.552	1337.21	31223.501	31344.155
EFT_WEXP	exponential	21	-15668.83	1258.932	31380.057	31500.711
EFT_WYUK	yukawa	21	-15772.936	1154.827	31588.268	31708.922
EFT_WPOW	powerlaw_tail	21	-15633.321	1294.442	31309.038	31429.692

Tabel S1b | Metrik Penutupan dan Ketangguhan (Strict; dipertahankan dari laporan asli)

Model (workspace)	ΔlogL penutupan (true-perm)	ΔlogL setelah shuffle kontrol negatif	Rentang ΔlogL pemindaian σ_int	Rentang ΔlogL pemindaian R_min	Rentang ΔlogL pemindaian cov-shrink
DM_RAZOR	126.678	22.725	—	—	—
EFT_BIN	231.611	14.984	459–1548	1243–1289	1337–1351
EFT_WEXP	171.977	6.04	408–1471	1169–1207	1259–1277
EFT_WYUK	179.808	14.688	380–1341	1065–1099	1155–1166
EFT_WPOW	280.513	6.672	457–1500	1203–1247	1294–1308

Tabel B0 | Definisi Cabang Penguatan DM dalam P1A (dipertahankan dari Lampiran B laporan asli)

Workspace	dm_model	Parameter baru (≤1)	Motivasi fisik (inti)	Prinsip implementasi (ramah audit)
DM_RAZOR	NFW (fixed c–M, no scatter)	—	Baseline halo LambdaCDM minimal yang dapat diaudit; digunakan sebagai perbandingan ketat dengan EFT	Pemetaan bersama tetap; buku besar parameter ketat; hanya digunakan sebagai baseline perbandingan relatif
DM_RAZOR_SCAT	NFW + c–M scatter (legacy)	σ_logc	Hubungan c–M memiliki scatter; didekati dengan scatter log-normal satu-parameter	≤1 parameter baru; tetap memakai pemetaan bersama; kenaikan penutupan menjadi kriteria penerimaan
DM_RAZOR_AC	NFW + Adiabatic Contraction (legacy)	α_AC	Infall barionik dapat menyebabkan kontraksi adiabatik halo; didekati dengan kekuatan satu-parameter	≤1 parameter baru; pemetaan tidak berubah; melaporkan perubahan AICc/BIC dan kenaikan penutupan
DM_RAZOR_FB	NFW + feedback core (legacy)	log r_core	Umpan balik dapat membentuk core bagian dalam; didekati dengan skala core satu-parameter	≤1 parameter baru; bingkai penutupan/kontrol negatif sama; perbaikan RC-only bukan satu-satunya tujuan
DM_HIER_CMSCAT	Hierarchical c–M scatter + prior	σ_logc (hier)	c_i∼logN(c(M_i),σ_logc) hierarkis yang lebih standar; memengaruhi posterior gabungan RC dan GGL	Prior eksplisit; latent c_i dimarginalkan; tetap berdimensi rendah dan dapat diaudit
DM_CORE1P	1‑parameter core proxy (coreNFW/DC14‑inspired)	log r_core	Menggunakan proksi core satu-parameter untuk efek utama umpan balik barionik, menghindari rincian pembentukan bintang berdimensi tinggi	Mengutip literatur standar; ≤1 parameter baru; diikat pada uji penutupan
DM_RAZOR_M	NFW + lensing shear‑calibration nuisance	m_shear (GGL)	Menyerap sistematika kunci di sisi pelensaan lemah dengan parameter efektif, mengurangi risiko memperlakukan sistematika sebagai fisika	Nuisance dicatat eksplisit; tidak boleh bereaksi balik ke RC; hasil terutama dinilai dari ketangguhan penutupan
DM_STD	Standardized DM baseline (HIER_CMSCAT + CORE1P + m)	σ_logc + log r_core (+ m_shear)	Membawa tiga keberatan paling umum ke dalam satu baseline terstandardisasi yang masih berdimensi rendah	Melaporkan buku besar parameter dan kriteria informasi bersama; penutupan adalah metrik utama; digunakan sebagai pembanding pertahanan DM terkuat

Tabel B1 | Scoreboard P1A (semakin besar semakin baik; dipertahankan dari Lampiran B laporan asli)

Cabang model (workspace)	Δk	RC-only best logL_RC (Δ)	Kekuatan penutupan ΔlogL_closure (Δ)	Joint best logL_total (Δ)
DM_RAZOR	0	-15702.654 (+0.000)	122.205 (+0.000)	-27347.068 (+0.000)
DM_RAZOR_SCAT	1	-15702.294 (+0.361)	121.236 (-0.969)	-23153.311 (+4193.758)
DM_RAZOR_AC	1	-15703.689 (-1.035)	121.531 (-0.674)	-23982.557 (+3364.511)
DM_RAZOR_FB	1	-15496.046 (+206.609)	129.454 (+7.249)	-27478.531 (-131.463)
DM_HIER_CMSCAT	1	-15702.644 (+0.010)	121.978 (-0.227)	-23153.160 (+4193.908)
DM_CORE1P	1	-15723.158 (-20.504)	122.056 (-0.149)	-27336.258 (+10.810)
DM_RAZOR_M	0 (+m)	-15702.654 (+0.000)	122.205 (+0.000)	-27340.451 (+6.617)
DM_STD	2 (+m)	-15832.203 (-129.549)	105.690 (-16.515)	-22984.445 (+4362.623)
EFT_BIN	1	-14631.537 (+1071.117)	204.620 (+82.415)	-19001.142 (+8345.926)

Cara Membaca Tabel B1 (Scoreboard P1A)

• Δk: derajat bebas yang baru ditambahkan (lebih besar berarti model lebih kompleks; lebih kompleks tidak otomatis berarti lebih baik). /

• Fokus pada dua kolom: kekuatan penutupan ΔlogL_closure(Δ) (lebih besar berarti konsistensi transfer lebih tinggi) dan Joint best logL_total(Δ) (skor total pencocokan gabungan). /

• Nilai dalam tanda kurung, (Δ), adalah selisih relatif terhadap DM_RAZOR, sehingga perbandingan langsung lebih mudah.

• Pertanyaan utama tabel ini adalah apakah keunggulan penutupan hilang setelah baseline DM “diperkuat secara wajar.” /

• Petunjuk baca: DM_STD meningkatkan skor gabungan secara mencolok, tetapi kekuatan penutupannya turun; EFT_BIN tetap lebih tinggi dalam kekuatan penutupan.

Dalam satu kalimat: di dalam kumpulan penguatan DM yang berdimensi rendah dan dapat diaudit ini, memperbaiki pencocokan gabungan tidak otomatis menghasilkan penutupan yang lebih kuat; penutupan, yakni keterpindahan, tetap menjadi kriteria kunci.

7 | Bagaimana Membaca Hasil Utama?

7.1 Pencocokan Gabungan: Jika Dua Set Data Dilihat Bersama, Skor Perbandingan Utama EFT Lebih Tinggi

Tabel S1a dan Gambar S4 menunjukkan bahwa, dengan data yang sama, pemetaan bersama yang sama, dan skala parameter yang kira-kira sama, keluarga EFT memiliki ΔlogL_total gabungan sebesar 1155–1337 relatif terhadap DM_RAZOR. Pembaca umum dapat memahaminya begini: di bawah aturan penilaian yang sama untuk gabungan dua data RC dan GGL, model perbandingan utama EFT memperoleh skor total yang lebih tinggi.

7.2 Uji Penutupan: Hal yang Paling Ingin Ditekankan P1 Adalah “Keterpindahan”

Kekuatan penutupan yang tinggi berarti parameter yang disimpulkan hanya dari RC dapat memprediksi GGL dengan lebih baik tanpa melihat GGL kembali. Dalam laporan P1, ΔlogL_closure EFT berada pada 172–281, sedangkan DM_RAZOR 127. Hasil ini lebih penting daripada sekadar “masing-masing bisa cocok dengan baik,” karena ia membatasi kebebasan model pada data kedua.

7.3 Kontrol Negatif: Mengapa “Runtuhnya Sinyal” Justru Hal yang Baik?

Setelah P1 mengacak korespondensi pengelompokan RC-bin→GGL-bin, sinyal penutupan EFT turun ke kisaran 6–23. Bagi pembaca umum, langkah ini seperti pemeriksaan anti-curang: jika keunggulan penutupan hanya disebabkan oleh kode, satuan, kovarians, atau kebetulan pencocokan, maka pengacakan korespondensi mungkin tetap memberi keunggulan. Namun hasil aktualnya adalah keunggulan itu runtuh, yang berarti ia bergantung pada pemetaan yang benar.

Gambar S3 | Kekuatan Penutupan (semakin besar semakin baik): keunggulan rata-rata log-likelihood untuk prediksi RC-only → GGL.

Cara Membaca Gambar Ini

Gambar ini adalah inti P1. Semakin tinggi batangnya, semakin baik informasi yang dipelajari dari RC berpindah ke GGL.

Keluarga EFT secara keseluruhan lebih tinggi daripada DM_RAZOR, yang menunjukkan penutupan lintas-probe EFT lebih kuat dalam eksperimen “belajar dari RC terlebih dahulu, lalu memprediksi GGL”.

Gambar S4 | Keunggulan Pencocokan Gabungan (semakin besar semakin baik): best logL_total RC+GGL relatif terhadap DM_RAZOR.

Cara Membaca Gambar Ini

Gambar ini menunjukkan skor total setelah RC dan GGL digabungkan.

Semua model EFT jauh di atas 0, yang menunjukkan bahwa keunggulan EFT dalam perbandingan utama bukan efek lokal satu titik, melainkan pola keseluruhan dalam analisis gabungan.

Gambar R1 | Kontrol Negatif: Sinyal Penutupan Turun Tajam Setelah Pengacakan Pengelompokan.

Cara Membaca Gambar Ini

Gambar ini menunjukkan bahwa begitu hubungan binning RC↔GGL yang benar diganggu, sinyal penutupan turun tajam.

Ini membuat hasil P1 lebih tampak sebagai konsistensi nyata dalam pemetaan lintas-data, bukan kebetulan numerik yang dapat diperoleh di bawah pemetaan sembarang.

8 | Ketangguhan dan Kontrol: Bagaimana P1 Menghindari Sekadar “Cocok yang Tampak Bagus”?

Tantangan paling mudah terhadap laporan teknis adalah bertanya apakah keunggulan muncul dari satu pengaturan kebisingan, satu pemotongan data wilayah pusat, satu perlakuan kovarians, atau overfitting. P1 menjawabnya dengan banyak uji tekanan.

Tabel 2 | Cara Membaca Uji Ketangguhan dan Kontrol Negatif P1

Uji	Kekhawatiran yang Ingin Disingkirkan	Cara Membacanya
Pemindaian σ_int	Jika RC mengandung scatter tambahan yang tidak diketahui, apakah kesimpulan tetap stabil?	Setelah galat RC dilonggarkan, peringkat EFT dan skala keunggulannya tetap stabil.
Pemindaian R_min	Jika wilayah pusat galaksi tidak sepenuhnya dipercaya, apakah kesimpulan tetap stabil?	Setelah wilayah pusat dipangkas, EFT tetap mempertahankan keunggulan positif.
Pemindaian cov-shrink	Jika estimasi kovarians GGL tidak pasti, apakah kesimpulan tetap stabil?	Setelah kovarians disusutkan ke arah matriks diagonal, keunggulan tidak sensitif.
Tangga ablasi	Apakah EFT mengandalkan kompleksitas yang tidak perlu untuk memaksakan pencocokan?	EFT_BIN lengkap didukung oleh kriteria informasi.
Prediksi LOO pada data yang ditahan	Apakah model hanya menjelaskan data yang sudah pernah dilihat?	Setelah satu GGL-bin ditahan, model tetap menunjukkan performa generalisasi yang kuat.
Shuffle RC-bin	Apakah penutupan berasal dari pemetaan yang benar?	Penutupan turun setelah pengelompokan diacak, mendukung ketergantungan pada pemetaan.

Gambar R2 | Rentang ΔlogL_total pada Pemindaian σ_int (semakin besar semakin baik).

Cara Membaca Gambar Ini

Menguji apakah keunggulan EFT tetap ada setelah perubahan asumsi scatter intrinsik RC.

Gambar R3 | Rentang ΔlogL_total pada Pemindaian R_min (semakin besar semakin baik).

Cara Membaca Gambar Ini

Menguji apakah keunggulan EFT tetap stabil setelah wilayah pusat yang kompleks dipangkas.

Gambar R4 | Rentang ΔlogL_total pada Pemindaian cov-shrink (semakin besar semakin baik).

Cara Membaca Gambar Ini

Menguji apakah peringkat sensitif terhadap perubahan perlakuan kovarians pelensaan lemah.

Gambar R5 | Tangga Ablasi EFT_BIN (AICc, semakin kecil semakin baik).

Cara Membaca Gambar Ini

Menguji apakah EFT_BIN lengkap diperlukan untuk menjelaskan data, bukan sekadar menambahkan parameter yang tidak perlu.

Gambar R6 | LOO: Distribusi Log-Likelihood untuk Bin yang Ditahan.

Cara Membaca Gambar Ini

Menguji apakah model masih memiliki performa prediktif pada GGL-bin yang belum pernah dilihat.

Gambar R7 | Kontrol Negatif: Pemetaan yang Diacak Menyebabkan Penurunan Jelas pada mean logL_true Penutupan.

Cara Membaca Gambar Ini

Lebih lanjut menunjukkan, dari sudut pandang mean logL_true, bahwa penutupan bergantung pada pemetaan lintas-data yang benar.

9 | P1A: Mengapa “Beberapa Model DM dalam Lampiran” Adalah Koreksi Kunci

Bagian ini tidak bertanya, “Apakah EFT hanya mengalahkan satu baseline minimal DM_RAZOR?” Ia bertanya apakah kesimpulan uji penutupan dan pencocokan gabungan berubah ketika baseline DM diperkuat dalam rentang yang berdimensi rendah, dapat direproduksi, dan memiliki buku besar parameter yang jelas (P1A). Dengan kata lain, tujuan P1A adalah menurunkan keberatan “Anda hanya memilih baseline DM yang terlalu lemah,” lalu mendorong diskusi ke pertanyaan: di bawah serangkaian penguatan DM yang dapat diaudit, apakah perbedaan performa penutupan tetap ada?

P1A tidak dirancang untuk menghabiskan semua kemungkinan pemodelan halo LambdaCDM, juga tidak mengubah sisi DM menjadi alat pencocok berdimensi tinggi yang tidak dapat diaudit. Ia memilih penguatan berdimensi rendah, dapat direproduksi, dan jelas buku besar parameternya: scatter konsentrasi, kontraksi adiabatik, core umpan balik, prior scatter c–M berlapis, proksi core satu-parameter, nuisance shear-calibration pelensaan lemah, serta DM_STD gabungan.

Pembacaan Utama P1A

Di antara tiga cabang legacy, hanya feedback/core yang menghasilkan kenaikan bersih kecil pada kekuatan penutupan; SCAT dan AC tidak menghasilkan kenaikan penutupan bersih.

DM_HIER_CMSCAT, DM_RAZOR_M, dan DM_CORE1P berdampak sangat kecil pada kekuatan penutupan atau tidak menunjukkan perbaikan bersih yang signifikan.

DM_STD dapat memperbaiki joint logL secara substansial, tetapi kekuatan penutupannya menurun, yang mengisyaratkan bahwa ia terutama meningkatkan fleksibilitas pencocokan gabungan, bukan daya prediksi transfer RC→GGL.

EFT_BIN tetap mempertahankan kekuatan penutupan yang lebih tinggi dan keunggulan pencocokan gabungan dalam Tabel B1 P1A; karena itu, klaim inti P1 tidak boleh direduksi menjadi “ia hanya mengalahkan DM_RAZOR minimal.”

Gambar B1 | Scoreboard P1A: ΔlogL Penutupan dan Gabungan Relatif terhadap Baseline (semakin besar semakin baik).

Cara Membaca Gambar Ini

Gambar ini menunjukkan performa beberapa cabang penguatan DM relatif terhadap baseline.

Maknanya bukan “semua DM dikecualikan,” melainkan ini: dalam penguatan DM berdimensi rendah dan dapat diaudit yang dipilih P1A, memperkuat DM tidak menghapus keunggulan penutupan EFT_BIN.

10 | Mengapa Eksperimen P1 Penting

10.1 Makna Metodologis: Menempatkan “Penutupan Lintas-Probe” di Atas “Pencocokan Satu-Probe”

Teori skala galaksi mudah terjebak dalam perdebatan apakah suatu model dapat mencocokkan satu kumpulan kurva rotasi tertentu. P1 menaikkan pertanyaannya satu tingkat: dapatkah parameter yang dipelajari dari RC memprediksi pelensaan lemah tanpa menyetel ulang ke GGL? Ini mengubah P1 dari “kompetisi pencocokan” menjadi “uji prediksi transfer.”

10.2 Makna Transparansi: Memperlakukan Rantai Reproduksibilitas sebagai Bagian dari Hasil

Salah satu kontribusi penting P1 adalah merilis data, tabel dan gambar, label run, kontrol negatif, paket reproduksi, dan rantai audit secara bersama. Ini penting bagi pendukung maupun pengkritik: diskusi dapat kembali ke data publik yang sama, pemetaan yang sama, skrip yang sama, dan metrik yang sama, bukan hanya membandingkan slogan.

10.3 Makna Fisik: Uji Tekanan Kuat bagi Arah “Gravitasi Non-Materi-Gelap”

Dalam arah gravitasi non-materi-gelap, banyak model dapat menjelaskan sebagian kurva rotasi atau RAR. Tugas yang lebih sulit adalah sekaligus lolos pembacaan pelensaan lemah dan menunjukkan, di bawah kontrol negatif, bahwa sinyal bergantung pada pemetaan yang benar. Makna P1 terletak di sini: ia menempatkan respons gravitasi rata-rata EFT ke dalam protokol yang menyerupai “ujian eksternal”: RC adalah ruang latihan, GGL adalah ruang transfer, dan shuffle adalah ruang anti-curang.

10.4 Apakah Ini Eksperimen Penting untuk Bidang “Gravitasi Non-Materi-Gelap”?

Dengan hati-hati: jika pemrosesan data, paket reproduksi, dan protokol penutupan P1 tetap bertahan setelah peninjauan eksternal, maka ia dapat dipandang sebagai eksperimen penutupan RC+GGL yang layak diperhatikan serius dalam arah gravitasi non-materi-gelap / gravitasi termodifikasi. Kepentingannya bukan pada kalimat “menumbangkan materi gelap,” melainkan pada penyediaan kriteria lintas-probe yang dapat disalin, ditantang, dan diperluas.

Apakah Sudah Ada Kerangka Prediksi-Penutupan RC+GGL pada Tingkat yang Sama?

Ada kerangka dan tradisi pengamatan yang relevan: MOND/RAR mengorganisasi banyak fenomena kurva rotasi dengan baik; pekerjaan RAR pelensaan lemah KiDS-1000 juga membandingkan MOND, gravitasi emergen Verlinde, dan model LambdaCDM; LambdaCDM juga dapat menjelaskan sebagian fenomena pelensaan lemah/dinamika melalui koneksi galaksi–halo, halo gas, dan pemodelan umpan balik.

Namun klaim tepat P1 bukan bahwa “tidak ada kerangka lain di dunia yang dapat menjelaskan RC+GGL.” Melainkan, di bawah protokol publik P1 sendiri—pemetaan tetap, penutupan RC-only→GGL, kontrol negatif shuffle, buku besar parameter, dan uji tekanan multi-DM P1A—EFT melaporkan performa penutupan yang lebih kuat.

Dengan kata lain, bagian P1 yang paling layak diuji secara eksternal adalah protokol perbandingannya yang konkret dan dapat direproduksi. Langkah berikut yang sangat berharga adalah melihat apakah MOND/RAR, LambdaCDM/HOD, simulasi hidrodinamika, atau kerangka gravitasi termodifikasi lain dapat mencapai skor penutupan yang sama atau lebih tinggi di bawah protokol yang sama.

11 | Apa yang Dapat dan Tidak Dapat Disimpulkan P1?

Tabel 3 | Batas Kesimpulan P1

Dapat Disimpulkan	Di bawah data RC+GGL P1, pemetaan tetap, dan protokol perbandingan utama, keluarga EFT memiliki skor pencocokan gabungan dan kekuatan penutupan yang lebih tinggi daripada DM_RAZOR minimal.
Dapat Disimpulkan	Dalam rentang penguatan DM berdimensi rendah dan dapat diaudit milik P1A, beberapa penguatan DM tidak menghapus keunggulan penutupan EFT_BIN.
Dapat Disimpulkan	Kontrol negatif shuffle menunjukkan bahwa sinyal penutupan bergantung pada pemetaan lintas-data yang benar dan tidak dapat diperoleh di bawah pemetaan sembarang.
Tidak Dapat Disimpulkan	Tidak dapat dikatakan bahwa P1 telah menumbangkan semua model materi gelap. P1A masih belum mencakup ketidaksferisan, ketergantungan lingkungan, koneksi galaksi–halo yang kompleks, umpan balik berdimensi tinggi, atau simulasi kosmologis penuh.
Tidak Dapat Disimpulkan	Tidak dapat dikatakan bahwa kerangka EFT lengkap telah dibuktikan dari prinsip pertama. P1 hanya menguji lapisan fenomenologis respons gravitasi rata-rata.
Tidak Dapat Disimpulkan	Tidak dapat dikatakan bahwa semua sistematika telah disingkirkan. P1 memberikan bukti ketangguhan hanya dalam uji tekanan dan cakupan audit yang tercantum.

12 | Pertanyaan Umum dari Pembaca Umum

Q1: Apakah ini berarti “materi gelap tidak ada”?

Tidak. Kesimpulan P1 harus dibatasi pada data, protokol, dan model pembanding yang digunakan di sini. P1A sudah melangkah lebih jauh daripada DM_RAZOR minimal, tetapi tetap tidak mewakili semua kemungkinan model materi gelap.

Q2: Apakah ini berarti “EFT sudah terbukti”?

Juga tidak. P1 menguji EFT sebagai parameterisasi respons gravitasi rata-rata dan menunjukkan performa yang lebih kuat dalam penutupan RC→GGL; mekanisme mikroskopis dan teori lengkap bukanlah kesimpulan P1.

Q3: Mengapa tidak langsung melaporkan nilai signifikansi σ?

P1 menggunakan skor likelihood terpadu, kriteria informasi, dan selisih penutupan. ΔlogL adalah keunggulan relatif di bawah aturan penilaian yang sama; ia tidak setara dengan satu nilai σ tunggal.

Q4: Mengapa mengacak RC-bin→GGL-bin?

Ini adalah kontrol negatif. Sinyal lintas-probe yang nyata harus bergantung pada pemetaan yang benar; jika setelah diacak sinyalnya tetap sama kuat, itu justru akan menunjukkan kemungkinan bias implementasi atau sinyal palsu statistik.

Q5: Apa langkah P1 berikutnya yang paling penting?

Memperluas protokol yang sama ke lebih banyak data, lebih banyak pembanding DM, sistematika yang lebih kompleks, dan lebih banyak kerangka gravitasi termodifikasi—terutama dengan cara yang memungkinkan tim eksternal menguji ulang di bawah metrik penutupan yang sama.

13 | Glosarium Mini

Tabel 4 | Glosarium Mini

Istilah	Penjelasan Satu Kalimat
Kurva rotasi (RC)	Hubungan radius–kecepatan rotasi dalam piringan galaksi, digunakan untuk menyimpulkan gravitasi efektif di dalam piringan.
Pelensaan lemah (GGL)	Pengukuran distribusi gravitasi/massa rata-rata di sekitar galaksi latar depan melalui distorsi statistik bentuk galaksi latar belakang.
Uji penutupan	Menggunakan posterior RC untuk memprediksi GGL, lalu membandingkannya dengan kontrol negatif dari pemetaan yang diacak.
Kontrol negatif	Sengaja merusak struktur kunci untuk melihat apakah sinyal menghilang; digunakan untuk menyingkirkan sinyal palsu.
Halo NFW	Profil kerapatan halo materi gelap yang umum digunakan dalam model materi gelap dingin.
Hubungan c–M	Hubungan antara konsentrasi halo materi gelap c dan massa M; apakah scatter diperbolehkan memengaruhi fleksibilitas model.
DM_STD	Cabang uji tekanan DM terstandardisasi dalam P1A yang menggabungkan beberapa penguatan DM berdimensi rendah dan satu suku nuisance pelensaan.
ΔlogL	Selisih log-likelihood antara dua model di bawah aturan penilaian yang sama; nilai positif berarti model pertama lebih baik.
Kovarians	Deskripsi matriks korelasi antar titik data; data pelensaan lemah biasanya memerlukan kovarians lengkap.

14 | Jalur Baca yang Disarankan dan Pintu Masuk Sitasi

1. Pertama, baca Bagian 0–2 dari panduan ini untuk membangun kesadaran masalah P1 dan peran EFT yang sengaja dibatasi dalam P1.

2. Lalu lihat Gambar S3, Gambar S4, serta Tabel S1a/S1b untuk memahami kekuatan penutupan, pencocokan gabungan, dan kontrol negatif.

3. Jika Anda khawatir “baseline DM terlalu lemah,” langsung baca Bagian 9 serta Tabel B1 / Gambar B1.

4. Untuk verifikasi teknis, kembali ke laporan teknis P1 v1.1, Tables & Figures Supplement, dan full_fit_runpack.

Pintu Masuk Arsip Utama

Laporan teknis P1 (tingkat rilis, Concept DOI): 10.5281/zenodo.18526334

Paket reproduksi penuh P1 (Concept DOI): 10.5281/zenodo.18526286

Basis pengetahuan terstruktur EFT (opsional, Concept DOI): 10.5281/zenodo.18853200

Catatan lisensi: laporan teknis menggunakan CC BY-NC-ND 4.0; paket reproduksi penuh menggunakan CC BY 4.0 (rujuk laporan teknis dan arsip Zenodo sebagai otoritatif).

15 | Referensi dan Latar Belakang Eksternal

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.