← Eksperimen

P1_RC_GGL: Uji Penutupan Ketat atas Dinamika Galaksi dan Pelensaan Lemah (Kurva Rotasi + GGL)

Kerangka Gravitasi Rata-Rata EFT vs. Baseline NFW Minimal untuk Materi Gelap Dingin (DM)

Penulis: Guanglin Tu
Email: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Afiliasi: EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (Tiongkok)
Versi: v1.1 | Tanggal: 2026-02-14

Pracetak (belum ditinjau sejawat) | Versi ini dimaksudkan untuk penyebaran publik dan reproduksibilitas, dan tidak mewakili versi final yang diterbitkan jurnal.

Lisensi: Laporan (CC BY-NC-ND 4.0); paket reproduksi lengkap (CC BY 4.0).

Laporan tingkat publikasi (Concept DOI): https://doi.org/10.5281/zenodo.18526334 Paket reproduksi lengkap (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 Ringkasan Eksekutif

Laporan ini merupakan edisi arsip tingkat publikasi yang disimpan di Zenodo. Laporan ini menyediakan rantai terpadu yang dapat diaudit, mencakup data, buku besar model, perbandingan adil, uji penutupan, dan bahan reproduksibilitas. Lampiran B (P1A) berfungsi sebagai suplemen ketangguhan. Fokusnya adalah uji tekanan dengan “baseline DM yang lebih standar + satu sistematika pelensaan utama,” yang digunakan untuk menilai sensitivitas kesimpulan utama terhadap pemodelan DM yang lebih realistis dan perlakuan sistematika pelensaan.

Kesimpulan inti (empat pernyataan yang dapat langsung dikutip; lihat Bagian 2.4):

(1) Dalam pencocokan kurva rotasi (RC), keluarga EFT secara signifikan mengungguli DM_RAZOR pada semua kombinasi kernel/prior; peningkatan tipikalnya adalah Δlog𝓛_RC ≈ 10^3 (lihat Tabel S1a).
(2) Dalam uji penutupan RC→GGL, EFT menunjukkan transferabilitas lintas-probe yang lebih kuat: kekuatan penutupan Δlog𝓛_closure (True−Perm) secara signifikan lebih tinggi daripada DM_RAZOR, dan perbedaannya tangguh terhadap penyusutan kovarians, R_min, dan pemindaian σ_int (lihat Gbr. S3 dan Tabel S1b).
(3) Dalam pencocokan gabungan (RC+GGL), EFT mempertahankan keunggulan yang stabil; pada kontrol negatif yang memutus pemetaan bersama, keunggulan ini runtuh, mendukung tafsir bahwa “efek gravitasi rata-rata” berasal dari pemetaan bersama, bukan dari pencocokan kebetulan (lihat Gbr. S4).
(4) Tanpa meningkatkan dimensionalitas secara substansial, Lampiran B (P1A) menguji sisi DM dengan modul baseline DM yang lebih standar dan satu nuisance sistematika pelensaan utama. Penguatan ini tidak menghapus keunggulan penutupan EFT (lihat Tabel B1 dan Gbr. B1).

Ketersediaan data dan kode: laporan Concept DOI 10.5281/zenodo.18526334; paket reproduksi lengkap Concept DOI 10.5281/zenodo.18526286. Tag yang sesuai dengan Lampiran B (P1A) adalah run_tag=20260213_151233, closure_tag=20260213_161731, dan joint_tag=20260213_195428.

1 Abstrak

Kami melakukan perbandingan kuantitatif yang dapat direproduksi atas dua kerangka teoritis dengan data yang sama dan protokol statistik yang sama: model “koreksi gravitasi rata-rata” yang diajukan oleh Teori filamen energi (Energy Filament Theory, EFT; berbeda dari singkatan umum effective field theory), dan model baseline halo NFW materi gelap dingin (DM), yaitu DM_RAZOR. DM_RAZOR sengaja dipilih sebagai “baseline DM minimal”: halo NFW dengan relasi c–M tetap (tanpa sebaran antarhalo), yang berfungsi sebagai kontrol yang dapat diaudit dan direproduksi. Perlu juga ditekankan bahwa makalah ini memperlakukan EFT sebagai parameterisasi fenomenologis mirip MOND untuk medan efektif/respons efektif yang diuji dalam protokol statistik terpadu, bukan sebagai derivasi prinsip pertama mikroskopisnya dalam pekerjaan ini.

Data terdiri atas 2.295 titik data kecepatan dari kurva rotasi (RC) SPARC, yang dipraproses dan dibinning secara seragam (104 galaksi, 20 bin RC), bersama dengan rapat permukaan berlebih ΔΣ(R) dari pelensaan lemah galaksi–galaksi (GGL) KiDS-1000 (4 bin massa bintang × 15 titik R per bin, total 60 titik, menggunakan kovarians penuh).

Kami secara berurutan melakukan inferensi RC-only, uji penutupan RC→GGL, inferensi GGL-only, dan inferensi gabungan RC+GGL, dengan audit konsistensi untuk memastikan bahwa setiap nilai numerik yang dikutip dapat dilacak. Di bawah buku besar parameter yang ketat dan batasan pemetaan bersama (DM: 20 parameter log M200_bin; EFT: 20 parameter log V0_bin + 1 log ℓ global), keluarga EFT secara signifikan mengungguli DM_RAZOR dalam pencocokan gabungan: ΔlogL_total = 1155–1337 relatif terhadap DM_RAZOR. Yang lebih penting, uji penutupan menunjukkan bahwa posterior RC memiliki daya prediksi nontrivial untuk GGL: kekuatan penutupan EFT adalah ΔlogL_closure = 172–281, lebih tinggi daripada DM_RAZOR sebesar 127. Ketika pengelompokan RC-bin→GGL-bin diacak, sinyal penutupan runtuh menjadi 6–23, menegaskan bahwa sinyal tersebut bukan kebetulan statistik atau artefak implementasi. Dalam pemindaian sistematik atas σ_int, R_min, dan penyusutan kovarians, keunggulan relatif EFT tetap positif dan stabil besarnya. Untuk menjawab kekhawatiran umum bahwa “baseline DM terlalu lemah” atau “sistematika keliru dianggap sebagai fisika,” Lampiran B (P1A) menyediakan uji tekanan baseline DM yang lebih standar namun tetap berdimensi rendah dan dapat diaudit, termasuk sebaran c–M hierarkis + prior, proksi inti satu parameter, lensing m, serta model gabungan DM_STD. Di bawah protokol penutupan yang sama, penguatan ini tidak menghapus keunggulan penutupan EFT (lihat Tabel B1/Gbr. B1).

Kata kunci: kurva rotasi; pelensaan lemah galaksi–galaksi; uji penutupan; EFT; materi gelap dingin; inferensi Bayesian

2 Pendahuluan dan Tinjauan Hasil

Kurva rotasi (RC) dan pelensaan lemah galaksi–galaksi (GGL) adalah dua probe gravitasi yang saling melengkapi: RC membatasi potensial dinamis dan relasi percepatan radial (RAR) pada bidang cakram, sedangkan GGL mengukur distribusi massa terproyeksi dan respons gravitasi pada skala halo. Bagi teori kandidat mana pun, pertanyaan kuncinya bukan apakah teori itu dapat mencocokkan dua dataset secara terpisah, melainkan apakah ia dapat menjelaskan keduanya secara konsisten di bawah pemetaan lintas-data yang sama dan batasan bersama yang sama.

Dengan demikian, makalah ini menjadikan “uji penutupan” sebagai protokol statistik intinya: pertama menggunakan posterior RC-only untuk memprediksi GGL ke depan, lalu membandingkannya dengan kontrol negatif di mana pemetaan RC-bin→GGL-bin dipermutasi/diacak. Ini mengevaluasi transferabilitas prediksi lintas-data dan menyingkirkan sinyal palsu yang disebabkan oleh bias implementasi atau pencocokan kebetulan.

Posisi teoritis dan cakupan: makalah ini tidak berupaya menyajikan derivasi prinsip pertama mikroskopis EFT (Energy Filament Theory) ataupun formulasi relativistik yang lengkap. Sebaliknya, kami memperlakukan EFT sebagai parameterisasi medan efektif/respons efektif berdimensi rendah dan mirip MOND (dideskripsikan oleh kernel f(x) dan skala global ℓ), serta menguji konsistensi lintas-data dan daya prediksi transfernya melalui uji penutupan RC→GGL di bawah buku besar parameter yang ketat.

Program penelitian dan pernyataan cakupan: makalah ini merupakan bagian dari program retrieval observasional seri P yang sedang berjalan. Dalam data skala galaksi yang tersedia, kami mencari dua kemungkinan kontribusi latar efektif: (i) “lantai gravitasi rata-rata” yang dapat dideskripsikan oleh respons gravitasi rata-rata hasil coarse-graining, dan (ii) “lantai stokastik/derau” yang terkait dengan fluktuasi dalam proses mikroskopis. Dalam makalah ini (P1), kami hanya berfokus pada yang pertama: tanpa memperkenalkan hipotesis apa pun tentang mekanisme produksi mikroskopis, kami menggunakan uji penutupan RC→GGL untuk mengambil indikasi observasional mengenai lantai gravitasi rata-rata dan membandingkannya dengan baseline DM yang dapat diaudit di bawah protokol kontrol terpadu. Sebagai gambaran fisik heuristik, jika derajat kebebasan berumur pendek memang ada, peluruhan/anihilasinya dapat mengubah massa diam menjadi energi-momentum yang dibawa oleh derajat kebebasan lain, yang pada tingkat efektif secara alami berkorespondensi dengan dekomposisi “kontribusi rata-rata + kontribusi fluktuasi”; namun, makalah ini tidak memodelkan gambaran mikroskopis itu secara kuantitatif.

Untuk menghindari penafsiran berlebihan, batas cakupan makalah ini adalah sebagai berikut:
• Yang dilakukan makalah ini: di bawah batasan buku besar parameter dan pemetaan bersama yang ketat, makalah ini menggunakan uji penutupan untuk mengukur transferabilitas prediksi lintas-data dan melakukan perbandingan yang dapat direproduksi antara respons gravitasi rata-rata EFT dan baseline DM.
• Yang tidak dilakukan makalah ini: makalah ini tidak membahas mekanisme produksi mikroskopis, kelimpahan/umur, atau batasan kosmologis; makalah ini tidak memodelkan suku stokastik yang berkorespondensi dengan “lantai derau.”
• Yang tidak diklaim makalah ini: makalah ini tidak bertujuan menggulingkan materi gelap; P1 tidak memberikan putusan final tentang apakah suatu “lantai” ada, tetapi melaporkan bukti tingkat-tahap—bahwa dalam domain pengukuran tangguh yang dipilih di sini, data lebih menyukai model yang memasukkan respons gravitasi rata-rata.

Pada saat yang sama, kami menegaskan bahwa DM_RAZOR hanya mewakili baseline NFW yang minimal dan dapat diaudit (c–M tetap dan tanpa scatter; tanpa kontraksi adiabatik, inti feedback, nonsferisitas, atau suku lingkungan). Karena itu, kesimpulan utama dalam teks utama secara ketat dibatasi pada pernyataan ini: di bawah baseline minimal dan batasan buku besar parameter/pemetaan yang ketat, EFT menunjukkan konsistensi lintas-data yang lebih kuat. Untuk menjawab pertanyaan umum apakah baseline ΛCDM yang lebih standar dan pemodelan sistematika pelensaan utama akan secara substansial mengubah kesimpulan, kami mengumpulkan penguatan DM yang lebih standar namun tetap berdimensi rendah dan dapat diaudit, serta nuisance sisi pelensaan, ke dalam Lampiran B (P1A: uji tekanan standardisasi baseline DM), sambil mempertahankan pemetaan bersama dan protokol uji penutupan yang persis sama seperti teks utama (lihat Tabel B1/Gbr. B1).

2.1 Tab S1a–S1b: Ringkasan Metrik Kunci (Strict)

Tabel S1a melaporkan metrik perbandingan utama untuk pencocokan gabungan (RC+GGL): logL, ΔlogL, AICc, dan BIC. Tabel S1b melaporkan metrik uji penutupan dan pemindaian ketangguhan: penutupan, kontrol negatif shuffle, serta rentang pemindaian σ_int / R_min / cov-shrink. Semua nilai berasal dari tabel ringkasan master strict Tab_Z1_master_summary dan dapat dilacak satu per satu dalam paket arsip rilis.

Tabel S1a | Metrik perbandingan utama pencocokan gabungan (RC+GGL, Strict).

Model (workspace)

Kernel W

k

logL_total gabungan (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabel S1b | Metrik penutupan dan ketangguhan (Strict).

Model (workspace)

ΔlogL penutupan (true-perm)

ΔlogL setelah shuffle kontrol negatif

Rentang ΔlogL pemindaian σ_int

Rentang ΔlogL pemindaian R_min

Rentang ΔlogL pemindaian cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Gbr. S3: Kekuatan Penutupan (RC-only → GGL Terprediksi)

Kekuatan penutupan didefinisikan sebagai ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: pada sampel posterior RC-only, GGL diprediksi ke depan dan dibandingkan dengan kontrol negatif di mana pemetaan RC-bin→GGL-bin dipermutasi.

Gbr. S3 | Kekuatan penutupan (semakin tinggi semakin baik): keunggulan log-likelihood rata-rata dari prediksi RC-only → GGL.


2.3 Gbr. S4: Perbandingan Utama Pencocokan Gabungan (RC+GGL)

Keunggulan pencocokan gabungan didefinisikan sebagai ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Dengan data yang sama, pemetaan yang sama, dan skala parameter yang hampir sama, keluarga EFT mencapai log-likelihood gabungan yang jauh lebih tinggi.

Gbr. S4 | Keunggulan pencocokan gabungan (semakin tinggi semakin baik): logL_total terbaik untuk RC+GGL relatif terhadap DM_RAZOR.


2.4 Empat Kesimpulan (Dapat Langsung Dikutip)

(1) Dalam analisis gabungan terpadu atas kurva rotasi SPARC dan pelensaan lemah KiDS-1000, model kerangka gravitasi rata-rata EFT secara sistematis mengungguli DM_RAZOR di bawah protokol kontrol ketat: ΔlogL_total = 1155–1337 relatif terhadap DM_RAZOR.

(2) Uji penutupan RC→GGL menunjukkan konsistensi prediktif yang lebih kuat untuk EFT: ΔlogL_closure = 172–281, dibandingkan dengan 127 untuk DM_RAZOR. Ketika pengelompokan RC-bin→GGL-bin diacak, sinyal penutupan runtuh menjadi 6–23, menunjukkan bahwa sinyal bergantung pada pemetaan lintas-data yang benar, bukan pada pencocokan kebetulan.

(3) Pemindaian sistematik atas σ_int, R_min, dan penyusutan kovarians tidak mengubah tanda maupun skala “EFT mengungguli DM_RAZOR,” yang menunjukkan bahwa kesimpulan ini tangguh terhadap gangguan sistematik umum.

(4) Di bawah protokol penutupan yang sama, Lampiran B (P1A) memperkuat baseline DM dengan cara yang “terstandardisasi dan dapat diaudit”: ia mempertahankan tiga penguatan satu-parameter (SCAT/AC/FB) dan menambahkan sebaran c–M hierarkis + prior, proksi inti satu parameter, serta kalibrasi shear sisi pelensaan m (dan model gabungan DM_STD). Hasilnya menunjukkan bahwa hanya cabang feedback/core yang membawa peningkatan bersih kecil dalam kekuatan penutupan (122.21→129.45, ΔΔlogL_closure≈+7.25); penguatan lain berkontribusi tidak signifikan atau negatif terhadap kekuatan penutupan. Dengan demikian, kesimpulan utama tidak bergantung pada DM_RAZOR sebagai baseline yang terlalu lemah.

3 Data dan Prapemrosesan

Studi ini menggunakan dua dataset publik. Dalam alur kerja rekayasa, pengunduhan, verifikasi checksum (sha256), dan prapemrosesan diselesaikan dengan skrip yang dapat dilacak. Untuk memastikan perbandingan lintas-model yang adil, semua workspace (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) berbagi produk data dan pemetaan bin yang persis sama.


3.1 Kurva Rotasi (RC, SPARC)

Data RC berasal dari berkas Rotmod_LTG dalam basis data SPARC (175 berkas rotmod). Setelah prapemrosesan, sampel pemodelan mencakup 104 galaksi dan 2.295 titik data (r, V_obs), dibagi menjadi 20 bin RC berdasarkan massa bintang dan kriteria terkait. Setiap titik data memuat radius r (kpc), kecepatan teramati V_obs (km/s), galat observasi σ_obs, serta kecepatan komponen gas/cakram/bulge (V_gas, V_disk, V_bul).


3.2 Pelensaan Lemah (GGL, KiDS-1000 / Brouwer+2021)

Data GGL menggunakan rapat permukaan berlebih ΔΣ(R) dari Gbr. 3 Brouwer et al. (2021) berdasarkan KiDS-1000 (4 bin massa bintang, 15 titik R per bin), bersama kovarians penuh yang disediakan. Dalam alur kerja rekayasa, kovarians bentuk-panjang asli direkonstruksi menjadi matriks 15×15 untuk setiap bin, dan audit Stage-B memverifikasi kewajaran dimensional dan numerik.


3.3 Pemetaan RC-bin → GGL-bin dan Ukuran Sampel Total

Keempat bin massa GGL dan 20 bin RC dihubungkan melalui pemetaan tetap: setiap bin GGL berkorespondensi dengan 5 bin RC, dan kontribusi RC-bin diberi bobot berdasarkan jumlah galaksi. Pemetaan ini dipertahankan tetap pada semua model dan menjadi batasan inti untuk perbandingan adil dalam uji penutupan dan pencocokan gabungan. Dataset gabungan final memuat n_total = 2355 titik (RC=2295, GGL=60).

4 Model dan Metode Statistik


4.1 Spesifikasi Matematis Minimal untuk EFT dan DM (Dapat Diaudit/Diuji)

Bagian ini memberikan spesifikasi matematis minimal yang dipetakan langsung ke implementasi.

(a) Model kurva rotasi (RC)

Untuk setiap titik data RC (r, V_obs, σ_obs), kami menggunakan superposisi komponen: V_mod²(r) = V_bar²(r) + V_extra²(r). Di sini V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Hasil utama dalam makalah ini mengambil Υ_d = Υ_b = 0.5, konsisten dengan rekomendasi empiris SPARC dan berguna untuk mengurangi derajat kebebasan yang tidak perlu.

(b) Koreksi gravitasi rata-rata EFT (EFT)

Suku tambahan EFT diparameterisasi dalam bentuk “kuadrat kecepatan rata-rata”: V_extra²(r) = V0_bin² · f(r/ℓ). Di sini V0_bin adalah parameter amplitudo untuk setiap bin RC (20 parameter), ℓ adalah skala global (1 parameter), dan f(x) adalah fungsi bentuk kernel tak berdimensi. Bentuk kernel yang dibandingkan dalam makalah ini (tidak satu pun memperkenalkan derajat kebebasan kontinu tambahan) adalah:

Motivasi fisik (diperluas): EFT menafsirkan respons gravitasi tambahan pada skala galaksi sebagai respons efektif yang diperoleh melalui coarse-graining/perataan skala atas aksi mikroskopis yang lebih kecil pada skala terbatas. Dalam makalah ini, kami tidak mengasumsikan mekanisme mikroskopis tertentu; sebaliknya, kami menggunakan parameterisasi minimal dan dapat diaudit untuk perbandingan terkontrol dan pengujian di bawah protokol statistik terpadu.

Untuk intuisi, suku tambahan dapat ditulis dalam bentuk percepatan: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Ketika r≫ℓ, f→1 dan V_extra→V0_bin, menghasilkan kontribusi kecepatan tambahan wilayah luar yang kira-kira datar. Ketika r≪ℓ dan f(x)≈x, skala percepatan karakteristik a0,bin≈V0_bin²/ℓ dapat diperkenalkan (hingga faktor fungsi-kernel O(1)), memberikan intuisi mirip MOND untuk skala transisi dari dalam ke luar.

Keluarga kernel diskret yang digunakan di sini (none/exponential/yukawa/powerlaw_tail) dapat dipandang sebagai proksi berdimensi rendah untuk berbagai “kemiringan awal / kecepatan transisi / ekor jarak jauh” (misalnya, screening mirip Yukawa versus respons berekor lebih panjang). Kernel-kernel ini digunakan untuk uji tekanan ketangguhan, bukan untuk menghabiskan seluruh ruang model. Dalam komponen pelensaan lemah, kami membangun massa dan rapat selubung efektif dari V_avg(r), lalu memproyeksikannya untuk memperoleh ΔΣ(R). Rapat efektif ini harus dipahami sebagai deskripsi efektif atas potensial pelensaan di bawah asumsi simetri bola dan pemetaan medan lemah (rincian lengkap dipindahkan ke Lampiran A).

Semua bentuk kernel di atas memenuhi f(x)→1 ketika x→∞ (yakni saturasi V_extra²→V0²), sambil memberikan pertumbuhan linear atau sublinear untuk x≪1: misalnya, exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Karena itu, bentuk kernel yang berbeda memiliki perbedaan teramati pada “kemiringan awal” radius kecil, kecepatan transisi, dan ekor luar, serta dapat dibedakan oleh uji gabungan RC+GGL dan uji penutupan.

Prediksi EFT untuk pelensaan lemah ΔΣ(R) diperoleh dengan menginferensi massa dan rapat selubung dari V_avg(r), diikuti integral proyeksi: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, dan ΔΣ(R)=Σ̄(<R)−Σ(R). Implementasi numeriknya menggunakan grid logaritmik dan menyempurnakannya secara adaptif dalam kasus luar biasa untuk memastikan stabilitas dan reproduksibilitas.

(c) DM_RAZOR: baseline halo materi gelap dingin NFW

Pada saat yang sama, kami menegaskan bahwa DM_RAZOR hanya mewakili baseline NFW yang minimal dan dapat diaudit (c–M tetap dan tanpa scatter; tanpa kontraksi adiabatik, inti feedback, nonsferisitas, atau suku lingkungan). Untuk mengurangi risiko “baseline strawman,” makalah ini tidak mengklaim bahwa efek-efek tersebut tidak ada. Sebaliknya, efek-efek itu dimasukkan dalam Lampiran B (P1A) sebagai uji tekanan berdimensi rendah dan dapat diaudit, termasuk perlakuan hierarkis atas sebaran c–M, proksi inti, dan nuisance kalibrasi shear sisi pelensaan.


4.2 Buku Besar Model dan Perbandingan Adil (Parameter Bersama = Definisi Penutupan)

Jumlah parameter dalam himpunan perbandingan utama adalah: DM_RAZOR k=20; keluarga EFT k=21 (parameter tambahannya adalah log ℓ global). Semua model berbagi data RC yang sama, data dan kovarians GGL yang sama, pemetaan RC-bin→GGL-bin yang sama, suku barionik yang sama, dan konversi satuan yang sama. Selain itu, bentuk kernel (none / exponential / yukawa / powerlaw_tail) adalah pilihan diskret dan tidak memperkenalkan parameter kontinu tambahan, sehingga mencegah keunggulan diperoleh dari “satu derajat kebebasan ekstra.”


4.3 Likelihood, Prior, dan Sampler

Likelihood RC adalah Gaussian diagonal: σ_eff² = σ_obs² + σ_int². Hasil utama menetapkan σ_int=5 km/s, dan Run-5 memindai σ_int. Likelihood GGL menggunakan Gaussian berkoviarians penuh untuk setiap bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Objektif gabungannya adalah logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Prior terutama mengodekan batas yang layak secara fisik (batas interval pada log ℓ, log V0, dan log M200); ketika Υ dan σ_int bebas diaktifkan, prior informatif lemah digunakan (lihat implementasi dan konfigurasi paket rilis untuk rinciannya).

Sampler menggunakan random walk Metropolis blok adaptif: setiap langkah hanya memperbarui sub-blok acak dari ruang parameter untuk meningkatkan tingkat penerimaan dalam dimensi tinggi, dan ukuran langkah diadaptasi ringan oleh tingkat penerimaan berjendela (target tingkat penerimaan sekitar 0,25). Hasil utama menggunakan mode cepat (pengaturan seperti n_steps=800), dan setiap workspace menghasilkan trace, residual, dan plot PPC untuk audit manual maupun terskrip.


4.4 Uji Penutupan dan Kontrol Negatif (Definisi)

Uji penutupan (Run-2) menguji apakah posterior RC-only dapat memprediksi GGL tanpa mencocokkan ulang GGL. Secara khusus, uji ini menghasilkan ΔΣ(R) ke depan untuk 4 bin GGL dari sampel posterior RC-only dan menghitung logL_true dengan kovarians penuh; kemudian ia memermutasi secara acak pemetaan kelompok RC-bin→GGL-bin untuk memperoleh logL_perm. Kekuatan penutupan didefinisikan sebagai ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Selain itu, Run-10 mengelompokkan ulang secara acak 20 bin RC menjadi 4×5 (shuffle) dan menghitung ulang penutupan, untuk menguji seberapa kuat sinyal penutupan bergantung pada pemetaan yang benar.

5 Hasil Utama dan Interpretasi


5.1 Hasil Utama Pencocokan Gabungan (RC+GGL)

logL_total terbaik dari pencocokan gabungan dan keunggulan relatif ΔlogL_total (relatif terhadap DM_RAZOR) ditampilkan dalam Tabel S1a dan Gbr. S4. Dalam himpunan perbandingan utama, EFT_BIN memiliki keunggulan gabungan terbesar (ΔlogL_total=1337.210), sementara bentuk kernel EFT lainnya juga mempertahankan keunggulan signifikan (1154.827–1294.442). Berdasarkan kriteria informasi (AICc/BIC), keluarga EFT juga secara signifikan mengungguli DM_RAZOR, menunjukkan bahwa keunggulan tersebut bukan akibat bias dari jumlah parameter.

Catatan: kontribusi utama terhadap ΔlogL_total≈1337 berasal dari suku RC (ΔlogL_RC≈1065 dalam dekomposisi gabungan, sekitar 80%). Ini dapat dipahami sebagai peningkatan moderat sekitar Δχ²≈0,90 per titik pada N=2295 titik data RC, yang secara alami terakumulasi menjadi keunggulan orde 10^3 di bawah likelihood Gaussian diagonal. Pada saat yang sama, GGL dan uji penutupan menyediakan batasan lintas-dataset yang independen, dan peringkatnya tetap stabil di bawah uji tekanan σ_int, R_min, dan cov-shrink (lihat Bagian 6 dan Tabel S1b).


5.2 Hasil Uji Penutupan (RC-only → GGL)

Besaran kunci uji penutupan ΔlogL_closure dilaporkan dalam Tabel S1b dan Gbr. S3. Keluarga EFT memiliki kekuatan penutupan 171.977–280.513, lebih tinggi daripada DM_RAZOR sebesar 126.678. Ini berarti bahwa, tanpa derajat kebebasan lintas-data tambahan yang diizinkan, sampel posterior yang diperoleh EFT dari data RC memiliki daya prediksi yang lebih kuat dan dapat ditransfer ke data GGL.

Kontrol negatif semakin mendukung relevansi fisik sinyal penutupan: ketika pengelompokan RC-bin→GGL-bin diacak, kekuatan penutupan EFT turun menjadi 6–15 (dengan perbedaan kecil antarkernel), sedangkan kekuatan penutupan baseline setinggi 172–281. “Runtuhnya sinyal” ini menyingkirkan keunggulan palsu yang disebabkan oleh implementasi numerik, galat satuan, atau penanganan kovarians yang tidak tepat.

Gbr. R1 | Kontrol negatif: setelah pengelompokan shuffle, sinyal penutupan turun secara signifikan (diplot dari metrik Tab_Z1).


5.3 Makna dan Batas Hasil

Kesimpulan studi ini adalah bahwa “di bawah dataset dan protokol ini, koreksi gravitasi rata-rata EFT mengungguli baseline DM_RAZOR yang diuji.” Perlu ditekankan bahwa sisi DM hanya menggunakan baseline NFW minimal dengan relasi c(M) tetap, tanpa pembentukan core, nonsferisitas, suku lingkungan, atau model koneksi galaksi–halo yang lebih kompleks. Karena itu, manuskrip ini tidak mengklaim mengecualikan semua keluarga model DM. Sebaliknya, ia menyediakan baseline kontrol yang dapat direproduksi dan berpusat pada uji penutupan untuk mengevaluasi apakah RC dan GGL dapat dijelaskan secara konsisten oleh parameter dan pemetaan lintas-data yang sama.

Untuk menjawab kekhawatiran umum ini, kami menyelesaikan proyek ekstensi independen, P1A (lihat Lampiran B). Tanpa mengubah pemetaan bersama RC-bin→GGL-bin atau kerangka audit, proyek ini memperkuat baseline DM secara “terstandardisasi dan dapat diaudit”: selain tiga penguatan satu-parameter (SCAT/AC/FB), proyek ini menambahkan (i) sebaran c–M hierarkis + prior massa–konsentrasi (DM_HIER_CMSCAT), (ii) proksi inti feedback barionik satu parameter (DM_CORE1P), dan (iii) nuisance kalibrasi shear sisi pelensaan lemah m (DM_RAZOR_M), serta melaporkan model gabungan DM_STD; EFT_BIN dipertahankan sebagai referensi kontrol.

• DM_RAZOR_SCAT (sebaran c–M) — memperkenalkan parameter sebaran konsentrasi antarhalo σ_logc untuk menguji apakah c(M) tetap secara sistematis meremehkan daya jelas DM;
• DM_RAZOR_AC (Kontraksi Adiabatik) — menggunakan satu parameter α_AC untuk menginterpolasi secara kontinu antara “tanpa kontraksi” dan “kontraksi standar,” menangkap kecenderungan barion untuk mengontraksikan halo bagian dalam dengan biaya minimal;
• DM_RAZOR_FB (Feedback/core) — menggunakan skala core (misalnya log r_core) untuk mendeskripsikan bagaimana pembentukan inner-core menekan kurva rotasi, sambil mempertahankan aproksimasi NFW pada skala pelensaan lemah.

Scoreboard kuantitatif P1A disediakan dalam Lampiran B, Tabel B1 / Gbr. B1 (dihasilkan otomatis dari Tab_S1_P1A_scoreboard). Pada metrik penutupan, DM_RAZOR_FB memberikan peningkatan bersih kecil (122.21→129.45, +7.25), sementara penguatan lainnya berkontribusi tidak signifikan atau negatif terhadap kekuatan penutupan. Pada sisi pencocokan gabungan, penambahan prior sebaran c–M hierarkis (DM_HIER_CMSCAT) atau model gabungan (DM_STD) dapat secara substansial meningkatkan joint logL, tetapi tidak meningkatkan kekuatan penutupan, yang mengisyaratkan bahwa kontribusinya terutama berupa fleksibilitas pencocokan gabungan, bukan transferabilitas lintas-probe. Karena itu, kesimpulan inti teks utama harus dibaca sebagai berikut: di bawah batasan pemetaan bersama dan uji penutupan yang ketat, keunggulan konsistensi lintas-data EFT tidak muncul karena memilih “baseline yang terlalu lemah” di sisi DM. Paket rilis P1A yang sesuai dengan Lampiran B (tabel/gambar suplemen dan full_fit_runpack) akan disertakan sebagai berkas tambahan di bawah Zenodo Concept DOI yang sama dengan full_fit_runpack makalah ini: https://doi.org/10.5281/zenodo.18526286.

6 Eksperimen Ketangguhan dan Kontrol


6.1 Pemindaian σ_int (Run-5)

Kami memindai secara sistematis scatter intrinsik RC σ_int dan mengulangi inferensi gabungan pada setiap σ_int, menghitung ΔlogL_total relatif terhadap DM_RAZOR. Nilai minimum/maksimum ΔlogL_total untuk setiap model di seluruh rentang pemindaian dilaporkan dalam Tabel S1b.

Gbr. R2 | Rentang ΔlogL_total di bawah pemindaian σ_int (semakin tinggi semakin baik).


6.2 Pemindaian R_min (Run-6)

Untuk menguji dampak sistematika dalam data wilayah pusat (seperti gerak nonsirkular, resolusi, dan pemodelan barionik yang tidak memadai), kami menerapkan potongan ambang R_min pada RC dan mengulangi inferensi gabungan. Keunggulan keluarga EFT tetap positif dan stabil skalanya di bawah pemindaian R_min.

Gbr. R3 | Rentang ΔlogL_total di bawah pemindaian R_min (semakin tinggi semakin baik).


6.3 Pemindaian cov-shrink (Run-7)

Untuk menguji ketidakpastian pada kovarians GGL, kami menerapkan shrinkage pada matriks kovarians setiap bin massa: C_α=(1−α)C+α·diag(C), lalu memindai α. Hasilnya menunjukkan bahwa keunggulan keluarga EFT tidak sensitif terhadap perlakuan ini.

Gbr. R4 | Rentang ΔlogL_total di bawah pemindaian cov-shrink (semakin tinggi semakin baik).


6.4 Tangga Ablasi (Run-8)

Dalam EFT_BIN, kami melakukan ablasi bersarang: dari model minimal (tanpa parameter bebas), ke versi yang hanya mempertahankan sejumlah kecil derajat kebebasan, dan akhirnya ke model lengkap amplitudo 20-bin + skala global. AICc/BIC menunjukkan bahwa model EFT_BIN lengkap sangat dibutuhkan oleh data.

Gbr. R5 | Tangga ablasi EFT_BIN (AICc; semakin rendah semakin baik).


6.5 Prediksi Holdout (Run-9)

Kami selanjutnya menjalankan uji leave-one-bin-out (LOO): di antara 4 bin massa GGL, satu bin ditahan setiap kali; inferensi diulang menggunakan bin yang tersisa (dan seluruh RC), lalu log-likelihood uji dievaluasi pada bin yang ditahan. Metrik ringkasan diberikan dalam tabel suplemen Tab_R3_leave_one_bin_out (produk Run-9; pola jalur berkas dicantumkan dalam daftar produk kunci pada Bagian 8.2). Keluarga EFT tetap jelas lebih unggul daripada DM_RAZOR bahkan dalam kasus holdout terburuk.

Gbr. R6 | LOO: distribusi log-likelihood untuk bin yang ditahan (dari produk Run-9).


6.6 Kontrol Negatif: Shuffle RC-bin (Run-10)

Run-10 mengelompokkan ulang secara acak 20 bin RC menjadi 4×5 dan menghitung ulang penutupan sambil mempertahankan posterior RC-only tanpa perubahan. Hasilnya menunjukkan bahwa, dibandingkan dengan pemetaan asli, shuffle secara signifikan menurunkan baik rata-rata logL_true penutupan maupun ΔlogL_closure (lihat Tabel S1b dan Gbr. R1), sehingga semakin mendukung interpretabilitas sinyal penutupan.

Gbr. R7 | Kontrol negatif: pemetaan shuffle menyebabkan penurunan jelas pada rata-rata logL_true penutupan (dari produk Run-10).

7 Audit Ketertelusuran dan Konsistensi (Provenance)

Semua nilai numerik yang dikutip dalam makalah ini dapat dilacak satu per satu dalam tabel ringkasan strict dan catatan audit arsip rilis. Untuk menjaga keterbacaan teks utama, rantai provenance lengkap (daftar tag, tabel audit, daftar checksum, dan metode verifikasi) dipindahkan ke Lampiran A.

8 Reproduksibilitas dan Arsip Zenodo

Pernyataan ketersediaan data dan kode: data kurva rotasi SPARC dan data pelensaan lemah KiDS-1000 yang digunakan dalam makalah ini adalah dataset publik. Laporan tingkat publikasi telah diarsipkan di Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), dan paket reproduksi lengkap telah diarsipkan di Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Langkah eksekusi terperinci, lingkungan dependensi, inventaris arsip, dan informasi verifikasi hash disediakan dalam Lampiran A; desain, tag run, dan keluaran uji tekanan standardisasi baseline DM (P1A) disediakan dalam Lampiran B.

Di bawah Concept DOI paket reproduksi lengkap yang sama (https://doi.org/10.5281/zenodo.18526286), kami menyediakan dua titik masuk reproduktif berdasarkan kasus penggunaan: • full_fit_runpack P1 (teks utama): mereproduksi analisis RC-only / closure / joint dan pemindaian ketangguhan untuk EFT vs DM_RAZOR, serta menghasilkan aset teks utama termasuk Tabel S1a/S1b dan Gbr. S3/S4; • full_fit_runpack P1A (Lampiran B): mereproduksi uji tekanan standardisasi baseline DM (SCAT/AC/FB + prior sebaran c–M hierarkis + core1p + lensing m + DM_STD, termasuk kontrol EFT_BIN), serta menghasilkan Tabel Lampiran B1 dan Gbr. B1. Tabel/gambar suplemen P1A dan full_fit_runpack akan disertakan sebagai berkas tambahan di bawah Concept DOI yang sama untuk mempertahankan satu titik masuk arsip.

9 Ucapan Terima Kasih dan Deklarasi


9.1 Ucapan Terima Kasih

Kami berterima kasih kepada tim SPARC dan KiDS-1000 atas penyediaan data dan dokumentasi publik, serta para peserta dalam alur kerja rekonstruksi dan audit proyek ini.


9.2 Kontribusi Penulis

Guanglin Tu bertanggung jawab atas pengajuan konsep, desain studi, implementasi rekayasa, kurasi data, analisis formal, implementasi dan audit alur kerja reproduksibilitas, serta penulisan manuskrip.


9.3 Pendanaan

Didanai sendiri oleh penulis, Guanglin Tu (tanpa pendanaan eksternal / tanpa nomor hibah).


9.4 Kepentingan yang Bersaing

Penulis, Guanglin Tu, berafiliasi dengan “EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (Tiongkok)”; tidak ada kepentingan bersaing lain yang dinyatakan.


9.5 Bantuan AI

OpenAI GPT-5.2 Pro dan Gemini 3 Pro digunakan untuk pemolesan bahasa, penyuntingan struktur, dan pengorganisasian alur kerja reproduksibilitas. Keduanya tidak digunakan untuk menghasilkan atau memodifikasi data, hasil, gambar, tabel, atau kode, maupun untuk menghasilkan sitasi. Penulis bertanggung jawab penuh atas isi dan akurasi sitasi seluruh manuskrip.

10 Referensi

Lampiran A: Rincian Ketertelusuran dan Reproduksibilitas

Lampiran ini merangkum informasi arsip jangka panjang untuk ketertelusuran dan reproduksibilitas, termasuk tag run, hasil audit, inventaris arsip, dan titik verifikasi kunci, sehingga pembaca dapat memeriksa dan mereproduksi pekerjaan ini sesuai kebutuhan.


A.1 Rincian Ketertelusuran dan Audit

Untuk memastikan ketertelusuran jangka panjang, proyek ini menggunakan tag bertimestamp untuk setiap run dan keluaran, serta menyimpan produk historis tanpa menimpanya. Nilai-nilai inti yang dikutip dalam manuskrip ini berasal dari kompilasi strict (compile_tag=20260205_035929) dan telah melewati audit konsistensi berikut:

• Semua tabel tingkat-tahap membawa run_tag dan tag stage; skrip kompilasi strict memilih sumber tabel kanonik yang “lengkap dan konsisten” dari report/tables.

• Nilai dalam Tab_Z1_master_summary dan Tab_Z2_conclusion_highlights dibandingkan satu per satu dengan tabel kanonik terpilih.

• Selama pembuatan PDF, audit tag dilakukan pada “tag tabel/gambar yang dirujuk” untuk memastikan bahwa produk kedaluwarsa tidak tercampur.

Tag kunci (untuk menemukan semua produk antara): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Hasil audit konsistensi: Tab_AUDIT_checks_strict melaporkan pass=9, fail=0, skip=0 (lihat paket rilis untuk rinciannya).


A.2 Langkah Eksekusi Reproduksibilitas dan Inventaris Arsip

Studi ini mengadopsi sistem reproduksibilitas yang terdiri dari “laporan tingkat publikasi + suplemen tabel/gambar + paket run yang dapat dijalankan ulang sepenuhnya.” Pembaca dapat langsung merujuk Tables & Figures Supplement untuk memverifikasi semua aset tabel/gambar yang dikutip dalam makalah; untuk mereproduksi nilai numerik dan rantai audit dari awal, mereka dapat menggunakan full_fit_runpack untuk mengunduh data dan menjalankan ulang alur kerja lengkap. Setelah selesai, skrip pembanding tabel referensi bawaan paket dapat digunakan untuk memverifikasi konsistensi nilai tabel.


A.2.1 Quickstart Reproduksi (RUN_FULL, Windows PowerShell)

Bagian ini memberikan jalur reproduksi yang lebih singkat (Windows PowerShell). Untuk pemeriksaan cepat, pembaca disarankan merujuk langsung Tables & Figures Supplement dan memverifikasi tabel serta gambar yang dikutip satu per satu. Untuk reproduksi end-to-end dan pembuatan semua tabel, gambar, serta produk audit, gunakan full_fit_runpack: ikuti README/ONE_PAGE_REPRO_CHECKLIST dalam paket untuk menjalankan verify_checksums.ps1 dan RUN_FULL.ps1 (Mode=full direkomendasikan).

Entri arsip Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Tag rantai utama untuk makalah ini: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.


A.2.2 Bahan Arsip dan Titik Verifikasi Kunci (Paket & checks)

Arsip Zenodo menyediakan tiga kategori bahan yang saling melengkapi: (1) laporan tingkat publikasi (makalah ini, v1.1; termasuk Lampiran B: uji tekanan standardisasi baseline DM P1A); (2) Tables & Figures Supplement (tabel dan gambar suplemen yang mencakup semua aset tabel/gambar yang dikutip dalam makalah ini, secara terpisah sesuai P1 dan P1A); dan (3) full_fit_runpack (paket reproduksi lengkap: mengunduh data dari awal dan menjalankan ulang seluruh alur kerja, secara terpisah sesuai P1 dan P1A). Item (1)–(2) mendukung pembacaan cepat dan verifikasi independen; item (3) menyediakan reproduksibilitas penuh end-to-end.

Kategori bahan

Nama berkas (contoh)

Fungsi dan posisi (urutan penggunaan yang disarankan)

Laporan tingkat publikasi (Tionghoa dan Inggris)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Laporan lengkap yang diarsipkan di Zenodo; teks utama memberikan kesimpulan kunci dan audit ketangguhan, sedangkan Lampiran B memberikan P1A (uji tekanan standardisasi baseline DM).

Tables & Figures Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Semua tabel (CSV) dan gambar (PNG) yang dikutip dalam teks utama, termasuk skrip pembuatan dan berkas tag.

Tables & Figures Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

Semua tabel dan gambar yang dikutip dalam Lampiran B (P1A), termasuk Tab_S1_P1A_scoreboard dan Fig_S1_P1A_scoreboard.

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

Reproduksi end-to-end lengkap: mengunduh data dari awal dan menjalankan ulang RC-only/closure/joint serta pemindaian ketangguhan.

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

Reproduksi end-to-end lengkap (Lampiran B): menjalankan ulang DM 7+1 + DM_STD (termasuk kontrol EFT_BIN) dan menghasilkan bahan lampiran; paket menyertakan skrip pembanding tabel referensi untuk memeriksa konsistensi nilai tabel.

Rekomendasi sitasi: ketika mengutip makalah ini atau bahan reproduksibilitas pendampingnya, mohon kutip Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

Produk kunci yang seharusnya muncul dan dapat dibandingkan setelah reproduksi meliputi:

Lampiran B: P1A—Uji Tekanan Standardisasi Baseline DM (DM 7+1 + DM_STD; dengan Kontrol EFT)

Lampiran ini mendokumentasikan proyek ekstensi (P1A) untuk “uji tekanan standardisasi baseline DM” yang konsisten dengan protokol penutupan dalam teks utama. Perannya adalah meningkatkan baseline DM_RAZOR minimal yang digunakan dalam teks utama (NFW + c–M tetap, tanpa scatter / tanpa kontraksi / tanpa core) menjadi set baseline DM yang lebih dekat dengan praktik astrofisika dan lebih tahan terhadap kritik umum, tanpa memperkenalkan banyak derajat kebebasan dan tanpa mengubah pemetaan bersama RC-bin→GGL-bin atau kerangka audit. P1A mencakup, dan merupakan superset dari, uji tekanan tiga cabang sebelumnya: ia mempertahankan SCAT/AC/FB sekaligus menambahkan sebaran c–M hierarkis + prior, proksi inti satu parameter, dan nuisance kalibrasi shear sisi pelensaan m; ia juga menyediakan model gabungan DM_STD. EFT_BIN dipertahankan sebagai referensi kontrol.

Catatan suplemen: kekuatan penutupan dan nilai terkait dalam Lampiran B (P1A) menggunakan anggaran Monte Carlo yang lebih besar (misalnya, ndraw=400, nperm=24) daripada anggaran cepat yang digunakan dalam teks utama untuk mencakup seluruh keluarga kernel EFT (misalnya, ndraw=60, nperm=12). Karena itu, nilai absolut dapat menunjukkan drift sampling tingkat O(10). Namun, perbandingan antarmodel dalam anggaran/tabel yang sama tetap adil, dan tanda serta skala keunggulan tetap stabil lintas anggaran.


B.1 Tujuan dan Posisi (Mengapa P1A, dan Mengapa sebagai Lampiran)

P1A tidak berupaya menghabiskan semua kemungkinan pilihan pemodelan halo ΛCDM (seperti nonsferisitas, ketergantungan lingkungan, koneksi galaksi–halo yang kompleks, atau fisika barion berdimensi tinggi). Sebaliknya, P1A mengikuti prinsip “berdimensi rendah, dapat diaudit, dapat direproduksi”: setiap modul penguatan hanya memperkenalkan ≤1 parameter efektif kunci dan tetap tunduk pada tiga batasan keras makalah ini:
(i) Buku besar parameter: setiap parameter baru harus dicatat secara eksplisit dan dilaporkan bersama kriteria informasi (AICc/BIC);
(ii) Pemetaan bersama: peta pengelompokan RC-bin→GGL-bin yang sama tetap digunakan; “menyetel pemetaan” secara terpisah untuk satu dataset tidak diizinkan;
(iii) Uji penutupan: setiap penguatan harus menunjukkan keuntungan nyata dalam prediksi transfer RC→GGL, bukan sekadar pencocokan RC-only yang lebih baik.


B.2 DM 7+1 + DM_STD: Definisi Modul, Parameter, dan Masuk ke Posterior Gabungan

Sebagai runpack independen, P1A menyediakan 8 workspace DM (DM 7+1) plus 1 kontrol EFT: mulai dari DM_RAZOR sebagai baseline, ia membangun tiga penguatan legacy satu-parameter (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), menambahkan tiga modul defensif yang lebih standar (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), lalu menyediakan model gabungan DM_STD. Tujuan bersama modul-modul ini adalah mencakup tiga kritik yang paling umum sambil meningkatkan dimensionalitas sesedikit mungkin: (a) bagaimana sebaran c–M dan prior masuk ke model hierarkis; (b) apakah efek utama feedback barionik dapat ditangkap oleh proksi inti satu-parameter; dan (c) apakah sistematika kunci sisi pelensaan dapat disalahartikan sebagai sinyal fisik.

Workspace

dm_model

Parameter baru (≤1)

Motivasi fisik (inti)

Prinsip implementasi (audit-friendly)

DM_RAZOR

NFW (c–M tetap, tanpa scatter)

Baseline halo ΛCDM minimal yang dapat diaudit; digunakan untuk perbandingan ketat dengan EFT

Pemetaan bersama ditetapkan; buku besar parameter ketat; hanya digunakan sebagai baseline untuk perbandingan relatif

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

Relasi c–M memiliki sebaran; didekati dengan scatter log-normal satu-parameter

≤1 parameter baru; pemetaan bersama dipertahankan; peningkatan penutupan digunakan sebagai kriteria penerimaan

DM_RAZOR_AC

NFW + kontraksi adiabatik (legacy)

α_AC

Infall barionik dapat menyebabkan kontraksi adiabatik halo; didekati dengan kekuatan satu-parameter

≤1 parameter baru; pemetaan tidak berubah; laporkan perubahan AICc/BIC dan peningkatan penutupan

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedback dapat membentuk core di wilayah dalam; didekati dengan skala core satu-parameter

≤1 parameter baru; protokol closure/negative-control yang sama; peningkatan RC-only bukan satu-satunya sasaran

DM_HIER_CMSCAT

Sebaran c–M hierarkis + prior

σ_logc (hier)

c_i∼logN(c(M_i),σ_logc) yang lebih standar dan hierarkis; memengaruhi posterior gabungan RC dan GGL

Prior eksplisit; c_i laten dimarginalkan; tetap berdimensi rendah dan dapat diaudit

DM_CORE1P

Proksi core 1-parameter (terinspirasi coreNFW/DC14)

log r_core

Menggunakan proksi core satu-parameter untuk efek utama feedback barionik, menghindari rincian pembentukan bintang berdimensi tinggi

Mengutip literatur standar; ≤1 parameter baru; terikat pada uji penutupan

DM_RAZOR_M

NFW + nuisance kalibrasi shear pelensaan

m_shear (GGL)

Menyerap sistematika utama pelensaan lemah sebagai parameter efektif, mengurangi risiko sistematika keliru dianggap fisika

Nuisance dicatat eksplisit; tidak dapat memengaruhi RC secara balik; hasil dinilai terutama berdasarkan ketangguhan penutupan

DM_STD

Baseline DM terstandardisasi (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Menggabungkan tiga kelas kritik paling umum ke dalam baseline standar yang tetap berdimensi rendah

Buku besar parameter + kriteria informasi dilaporkan; closure adalah metrik utama; digunakan sebagai kontrol defensif terkuat untuk DM

Catatan: nama parameter di atas mengikuti implementasi rekayasa (misalnya, σ_logc, α_AC, log r_core, dan m_shear). Fokus desain P1A adalah “membuat baseline DM agak lebih kuat sambil tetap dapat diaudit,” bukan mengubah sisi DM menjadi pencocok berdimensi tinggi yang tidak terkendali. Khususnya, DM_HIER_CMSCAT memperkenalkan sebaran c–M secara hierarkis: konsentrasi c_i setiap halo diberi sebaran log-normal di sekitar c(M_i), dibatasi oleh σ_logc global dan prior c(M); struktur hierarkis ini memengaruhi posterior gabungan baik RC maupun GGL.


B.3 Protokol Statistik dan Konvensi Produk yang Konsisten dengan Teks Utama

P1A menggunakan kembali semua produk data, pemetaan bersama, dan kerangka audit dari teks utama. Urutan eksekusi dan konvensi produk tetap konsisten:
(1) Run‑1: inferensi RC-only (menghasilkan posterior_samples.npz dan metrics.json);
(2) Run‑2: uji penutupan RC→GGL (menghasilkan closure_summary.json dan baseline terpermutasi);
(3) Run‑3: pencocokan gabungan RC+GGL (menghasilkan joint_summary.json).
Semua angka yang dikutip berasal dari tabel yang dikompilasi otomatis (Tab_S1_P1A_scoreboard) dan dapat diperiksa setelah menjalankan ulang alur kerja P1A lengkap menggunakan skrip pembanding tabel referensi yang tertanam dalam P1A full_fit_runpack.


B.4 Hasil Utama, Titik Masuk Tabel/Gambar, dan Rencana Arsip (DOI yang Sama)

Bagian ini memberikan kesimpulan kuantitatif inti P1A. Tabel B1 merangkum metrik kunci untuk RC-only, penutupan RC→GGL, dan pencocokan gabungan RC+GGL (tanda kurung menunjukkan perbedaan relatif terhadap baseline DM_RAZOR). Kekuatan penutupan didefinisikan sebagai ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (semakin tinggi semakin baik). Gbr. B1 memvisualisasikan scoreboard yang sama. Poin utamanya adalah sebagai berikut:
• Di antara tiga cabang legacy, hanya DM_RAZOR_FB (feedback/core) yang memberi peningkatan bersih kecil dalam kekuatan penutupan: 122.21→129.45 (+7.25); SCAT dan AC tidak memberi peningkatan bersih;
• DM_HIER_CMSCAT dan DM_RAZOR_M yang baru ditambahkan memiliki efek sangat kecil (~0) pada kekuatan penutupan, dan DM_CORE1P juga tidak menunjukkan peningkatan bersih yang signifikan;
• Model gabungan DM_STD dapat secara substansial meningkatkan joint logL (lebih dekat ke optimum pencocokan gabungan), tetapi kekuatan penutupannya menurun, yang mengisyaratkan bahwa keuntungannya terutama berasal dari fleksibilitas pencocokan gabungan, bukan transferabilitas lintas-probe;
• Sebagai kontrol, EFT_BIN tetap mempertahankan keunggulan jelas baik dalam kekuatan penutupan maupun pencocokan gabungan. Karena itu, kesimpulan utama tangguh terhadap diperkenalkannya “baseline DM yang lebih kuat + nuisance pelensaan.”

Untuk perbandingan langsung dengan hasil teks utama, Tabel S1a–S1b merangkum perbandingan strict antara keluarga EFT dan DM_RAZOR: model EFT meningkatkan pencocokan gabungan sebesar ΔlogL_total≈1155–1337 relatif terhadap DM_RAZOR dan mencapai ΔlogL_closure=172–281 dalam uji penutupan. P1A hanya membuat “kontrol yang lebih keras” di sisi DM; tujuannya adalah mengurangi kekhawatiran seperti “baseline strawman” atau “systematics-as-physics,” bukan menggantikan perbandingan utama.

Tabel B1 | Scoreboard P1A (semakin tinggi semakin baik; tanda kurung menunjukkan perbedaan relatif terhadap baseline DM_RAZOR).

Cabang model (workspace)

Δk

logL_RC terbaik RC-only (Δ)

Kekuatan penutupan ΔlogL_closure (Δ)

logL_total gabungan terbaik (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Gbr. B1 | Scoreboard P1A: penutupan dan joint ΔlogL relatif terhadap baseline (semakin tinggi semakin baik).

Contoh tag untuk set run lengkap yang sesuai dengan lampiran ini adalah sebagai berikut (digunakan untuk menemukan produk antara P1A dan tabel/gambar):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 Sitasi yang Disarankan (Catatan Sitasi Lampiran)

Ketika pembaca perlu mengutip “uji tekanan standardisasi baseline DM” sebagai tambahan terhadap kesimpulan utama makalah ini, disarankan agar mereka mengutip kesimpulan utama bersama catatan berikut: “Lihat Lampiran B (P1A) untuk uji tekanan baseline DM terstandardisasi (legacy SCAT/AC/FB + prior sebaran c–M hierarkis + proksi inti + nuisance kalibrasi shear pelensaan), di bawah protokol penutupan yang sama.”