← Eksperimen

Teori filamen energi (Energy Filament Theory, EFT): kerangka gravitasi rerata dibandingkan dengan garis dasar NFW minimal untuk materi gelap dingin (DM)

Penulis: Guanglin Tu
Email: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Afiliasi: Kelompok Kerja EFT, Shenzhen Energy Filament Science Research Co., Ltd. (Tiongkok)
Versi: v1.1 | Tanggal: 2026-02-14

Preprint (belum ditelaah sejawat) | Versi ini ditujukan untuk diseminasi terbuka dan pemeriksaan yang dapat direplikasi; versi ini bukan versi akhir publikasi jurnal.

Lisensi: laporan (CC BY-NC-ND 4.0); paket replikasi lengkap (CC BY 4.0).

Laporan layak terbit (Concept DOI): https://doi.org/10.5281/zenodo.18526334
Paket replikasi lengkap (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 Ringkasan Eksekutif (Executive Summary)

Laporan ini merupakan edisi arsip lengkap yang layak terbit di Zenodo (edisi arsip). Ia menyediakan rantai audit terpadu, mulai dari data, catatan model, perbandingan yang adil, uji penutupan, hingga bahan replikasi. Lampiran B (P1A) berfungsi sebagai pelengkap ketahanan: di dalamnya dikumpulkan uji tekanan “garis dasar DM yang lebih standar + galat sistematik lensa yang kunci” untuk memeriksa sensitivitas kesimpulan utama terhadap pemodelan DM yang lebih realistis dan penanganan sistematika pelensaan.

Kesimpulan inti (empat kalimat yang dapat dikutip langsung; lihat Bagian 2.4):

(1) Dalam pencocokan kurva rotasi (RC), keluarga model EFT secara nyata mengungguli DM_RAZOR pada semua kombinasi fungsi kernel/prior; peningkatan tipikalnya adalah Δlog𝓛_RC ≈ 10^3 (lihat Tabel S1a).
(2) Dalam uji penutupan RC→GGL, EFT menunjukkan keteralihan lintas-probe yang lebih kuat: kekuatan penutupan Δlog𝓛_closure (True−Perm) jauh lebih tinggi daripada DM_RAZOR, dan perbedaannya tetap robust terhadap pemindaian shrinkage kovarians, R_min, dan σ_int (lihat Gambar S3 dan Tabel S1b).
(3) Dalam pencocokan gabungan (RC+GGL), EFT tetap mempertahankan keunggulan yang stabil; pada kontrol negatif yang merusak pemetaan bersama, keunggulan ini runtuh. Hal ini mendukung bahwa “efek gravitasi rerata” berasal dari pemetaan bersama, bukan dari kebetulan pencocokan (lihat Gambar S4).
(4) Lampiran B (P1A), tanpa menambah dimensi secara berarti, melakukan uji tekanan terhadap sisi DM dengan modul garis dasar DM yang lebih standar dan satu parameter nuisance kunci untuk sistematika pelensaan; penguatan ini tidak menghapus keunggulan penutupan EFT (lihat Tabel B1 dan Gambar B1).

Ketersediaan data dan kode: laporan Concept DOI 10.5281/zenodo.18526334; paket replikasi lengkap Concept DOI 10.5281/zenodo.18526286. Untuk Lampiran B (P1A), tag terkait adalah run_tag=20260213_151233, closure_tag=20260213_161731, joint_tag=20260213_195428.

1 Abstrak

Kami melakukan perbandingan kuantitatif yang dapat direplikasi antara dua kerangka teori pada data yang sama dan di bawah protokol statistik yang sama: model “koreksi gravitasi rerata” yang diajukan oleh Teori filamen energi (Energy Filament Theory, EFT; tidak sama dengan singkatan umum Effective Field Theory), dan model garis dasar halo NFW untuk materi gelap dingin (DM_RAZOR). DM_RAZOR sengaja dipilih sebagai “garis dasar DM minimal”: halo NFW + relasi c–M tetap (tanpa halo-to-halo scatter), agar menjadi pembanding yang dapat diaudit dan diperiksa ulang. Perlu ditekankan pula bahwa dalam makalah ini EFT diperlakukan sebagai parameterisasi efektif yang fenomenologis dan mirip MOND untuk Medan Efektif, digunakan untuk pengujian di bawah protokol statistik terpadu, bukan sebagai penurunan prinsip pertama mikroskopisnya.

Data yang digunakan mencakup: 2295 titik kecepatan dari kurva rotasi SPARC (RC) setelah praproses dan pembagian bin yang seragam (104 galaksi, 20 RC-bin), serta kerapatan permukaan ekuivalen ΔΣ(R) dari pelensaan lemah galaksi–galaksi KiDS-1000 (GGL): 4 bin massa bintang × 15 titik R per bin, total 60 titik, dengan kovarians lengkap.

Kami secara berurutan menjalankan inferensi RC-only, uji penutupan RC→GGL (closure), inferensi GGL-only, dan inferensi gabungan RC+GGL; audit konsistensi memastikan semua angka yang dikutip dapat dilacak. Di bawah catatan parameter yang ketat dan kendala pemetaan bersama (DM: 20 parameter log M200_bin; EFT: 20 parameter log V0_bin + 1 log ℓ global), keluarga EFT secara signifikan mengungguli DM_RAZOR pada pencocokan gabungan: ΔlogL_total = 1155–1337 (relatif terhadap DM_RAZOR). Yang lebih penting, uji penutupan memperlihatkan bahwa posterior RC memiliki daya prediksi yang tidak sepele untuk GGL: kekuatan penutupan EFT ΔlogL_closure = 172–281, lebih tinggi daripada 127 pada DM_RAZOR; setelah pengacakan pengelompokan RC-bin→GGL-bin, sinyal penutupan runtuh menjadi 6–23, yang menunjukkan bahwa sinyal tersebut bukan kebetulan statistik atau bias implementasi. Pada pemindaian sistematis σ_int, R_min, dan shrinkage kovarians, keunggulan relatif EFT tetap positif dan stabil dalam orde besarnya. Untuk menanggapi keberatan umum bahwa “garis dasar DM terlalu lemah / sistematika dianggap sebagai fisika”, Lampiran B (P1A) menyediakan uji tekanan garis dasar DM yang lebih standar, tetap berdimensi rendah dan dapat diaudit (termasuk hierarchical c–M scatter + prior, proksi core satu-parameter, lensing m, serta DM_STD gabungan); di bawah protokol penutupan yang sama, penguatan ini tidak menghapus keunggulan EFT (lihat Tabel B1/Gambar B1).

Kata kunci: kurva rotasi; pelensaan lemah galaksi–galaksi; uji penutupan; EFT; materi gelap dingin; inferensi Bayes

2 Pendahuluan dan Ikhtisar Hasil

Kurva rotasi (RC) dan pelensaan lemah galaksi–galaksi (GGL) adalah dua probe gravitasi yang saling melengkapi: RC membatasi potensial dinamik di bidang disk dan relasi percepatan radial (RAR), sedangkan GGL mengukur distribusi massa terproyeksi dan respons gravitasi pada skala halo. Bagi teori kandidat apa pun, yang menentukan bukanlah apakah ia mampu mencocokkan dua set data secara terpisah, melainkan apakah ia mampu memberi penjelasan yang konsisten di bawah satu pemetaan lintas-data dan satu himpunan kendala bersama.

Karena itu, makalah ini menjadikan “uji penutupan” (closure test) sebagai protokol statistik inti: posterior RC-only terlebih dahulu digunakan untuk memprediksi GGL secara maju, kemudian dibandingkan dengan kontrol negatif yang memutasi pemetaan RC-bin→GGL-bin (permutation / shuffle). Dengan cara ini, daya prediksi yang dapat dialihkan lintas-data (predictive transferability) dapat dinilai, sekaligus sinyal palsu akibat bias implementasi atau pencocokan kebetulan dapat disingkirkan.

Penentuan posisi teori dan ruang lingkup: makalah ini tidak berupaya menurunkan prinsip pertama mikroskopis EFT (Teori filamen energi) atau membangun bentuk relativistiknya yang lengkap. Sebaliknya, kami memperlakukan EFT sebagai parameterisasi efektif berdimensi rendah yang mirip MOND untuk medan/respons efektif (dideskripsikan oleh fungsi kernel f(x) dan skala global ℓ), lalu menguji konsistensi lintas-data dan kemampuan prediksi yang dapat dialihkannya melalui uji penutupan RC→GGL di bawah catatan parameter yang ketat.

Rencana riset dan batas ruang lingkup: makalah ini merupakan bagian dari program pencarian observasional seri P yang berkelanjutan. Pada data skala galaksi yang tersedia, kami mencari dua kemungkinan kontribusi latar efektif: (i) “lantai gravitasi” (mean gravity floor) yang dapat dideskripsikan oleh respons gravitasi rerata setelah pengkasaran skala, dan (ii) “lantai derau” (stochastic/noise floor) yang terkait dengan fluktuasi proses mikroskopis. Dalam makalah ini (P1), kami hanya berfokus pada yang pertama: tanpa memperkenalkan asumsi apa pun mengenai mekanisme asal mikroskopis, kami mencari tanda observasional lantai gravitasi rerata melalui uji penutupan RC→GGL, lalu membandingkannya dengan garis dasar DM yang dapat diaudit di bawah protokol pembanding terpadu. Sebagai gambaran fisik heuristik, jika ada derajat kebebasan berumur pendek, peluruhan/anihilasinya dapat mengubah massa diam menjadi energi-momentum yang dibawa oleh derajat kebebasan lain; pada tingkat efektif, ini secara alami bersesuaian dengan penguraian “kontribusi rerata + kontribusi fluktuatif”. Namun makalah ini tidak membuat model kuantitatif untuk gambaran mikroskopis tersebut.

Untuk menghindari penafsiran berlebihan, batas ruang lingkup makalah ini ditetapkan sebagai berikut:
• Apa yang dilakukan makalah ini: di bawah catatan parameter yang ketat dan kendala pemetaan bersama, mengukur daya prediksi yang dapat dialihkan melalui uji penutupan, serta membandingkan respons gravitasi rerata EFT dengan garis dasar DM secara dapat direplikasi.
• Apa yang tidak dilakukan makalah ini: tidak membahas mekanisme kemunculan mikroskopis, kelimpahan/umur hidup, ataupun kendala kosmologis; tidak memodelkan suku acak yang bersesuaian dengan “lantai derau”.
• Apa yang tidak diklaim makalah ini: tidak bertujuan menggulingkan materi gelap; P1 tidak memberi putusan akhir mengenai apakah “lantai” itu ada, melainkan melaporkan bukti tahap antara—dalam ranah pengukuran robust yang dipilih di sini, data lebih menyukai model yang memuat respons gravitasi rerata.

Pada saat yang sama, kami menegaskan bahwa DM_RAZOR hanya mewakili garis dasar NFW yang minimal dan dapat diaudit (c–M tetap tanpa scatter; tanpa Adiabatic Contraction, core feedback, nonsferisitas, maupun suku lingkungan). Karena itu, kesimpulan utama teks dibatasi secara ketat: di bawah garis dasar minimal ini dan di bawah catatan parameter/pemetaan yang ketat, konsistensi lintas-data EFT lebih kuat. Untuk menanggapi pertanyaan umum apakah garis dasar ΛCDM yang lebih standar dan pemodelan galat sistematik pelensaan yang kunci dapat mengubah kesimpulan secara berarti, kami mengumpulkan penguatan DM yang lebih standar tetapi tetap berdimensi rendah dan dapat diaudit, bersama nuisance sisi pelensaan, ke dalam Lampiran B (P1A: uji tekanan standardisasi garis dasar DM), dengan pemetaan bersama dan protokol uji penutupan yang sepenuhnya sama seperti teks utama (lihat Tabel B1/Gambar B1).

2.1 Tab S1a–S1b: Ringkasan Indikator Kunci (Strict)

Tabel S1a menyajikan indikator utama perbandingan pencocokan gabungan (RC+GGL), termasuk logL, ΔlogL, AICc, dan BIC; Tabel S1b menyajikan indikator uji penutupan dan pemindaian ketahanan, termasuk closure, kontrol negatif shuffle, serta rentang pemindaian σ_int / R_min / cov-shrink. Semua angka berasal dari tabel ringkasan ketat utama Tab_Z1_master_summary, dan setiap butir dapat dilacak di dalam paket arsip rilis.

Tabel S1a | Indikator utama perbandingan pencocokan gabungan (RC+GGL, Strict).

Model (workspace)

Kernel W

k

logL_total gabungan (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabel S1b | Indikator penutupan dan ketahanan (Strict).

Model (workspace)

ΔlogL penutupan (true-perm)

ΔlogL setelah shuffle kontrol negatif

Rentang ΔlogL pada pemindaian σ_int

Rentang ΔlogL pada pemindaian R_min

Rentang ΔlogL pada pemindaian cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Fig S3: Kekuatan Penutupan (RC-only → prediksi GGL)

Kekuatan penutupan didefinisikan sebagai ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: pada sampel posterior RC-only, GGL diprediksi secara maju, lalu dibandingkan dengan kontrol negatif berupa pemutasi pemetaan RC-bin→GGL-bin.

Gambar S3 | Kekuatan penutupan (semakin besar semakin baik): keunggulan rerata log-likelihood prediksi RC-only → GGL.


2.3 Fig S4: Perbandingan Utama Pencocokan Gabungan (RC+GGL)

Keunggulan pencocokan gabungan didefinisikan sebagai ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Pada data yang sama, pemetaan yang sama, dan skala parameter yang hampir sama, keluarga EFT memperoleh log-likelihood gabungan yang jauh lebih tinggi.

Gambar S4 | Keunggulan pencocokan gabungan (semakin besar semakin baik): best logL_total RC+GGL relatif terhadap DM_RAZOR.


2.4 Empat Kesimpulan (dapat dikutip langsung)

(1) Dalam analisis gabungan terpadu terhadap kurva rotasi SPARC + pelensaan lemah KiDS-1000, model kerangka gravitasi rerata EFT secara sistematis mengungguli DM_RAZOR di bawah protokol pembanding yang ketat: ΔlogL_total = 1155–1337 (relatif terhadap DM_RAZOR).

(2) Uji penutupan RC→GGL menunjukkan bahwa konsistensi prediktif EFT lebih kuat: ΔlogL_closure = 172–281, sedangkan DM_RAZOR bernilai 127; setelah pengacakan pengelompokan RC-bin→GGL-bin, sinyal penutupan runtuh menjadi 6–23, yang menunjukkan bahwa sinyal tersebut bergantung pada pemetaan lintas-data yang benar, bukan pada pencocokan kebetulan.

(3) Pemindaian sistematis terhadap σ_int, R_min, dan shrinkage kovarians tidak mengubah tanda maupun orde besar “EFT lebih baik daripada DM_RAZOR”, sehingga kesimpulan ini robust terhadap gangguan sistematik yang umum.

(4) Lampiran B (P1A) memperkuat garis dasar DM secara “terstandar dan dapat diaudit” di bawah protokol penutupan yang sama: tiga cabang penguatan satu-parameter (SCAT/AC/FB) dipertahankan, lalu ditambahkan hierarchical c–M scatter + prior, proksi core satu-parameter, serta kalibrasi shear m pada sisi pelensaan (beserta kombinasinya, DM_STD). Hasilnya menunjukkan: hanya cabang feedback/core yang memberi kenaikan bersih kecil pada kekuatan penutupan (122.21→129.45, ΔΔlogL_closure≈+7.25); penguatan lainnya tidak memberi kontribusi signifikan atau bernilai negatif terhadap kekuatan penutupan. Karena itu, kesimpulan utama teks tidak bergantung pada asumsi bahwa DM_RAZOR terlalu lemah.

3 Data dan Praproses

Studi ini menggunakan dua jenis data publik, dan di dalam alur rekayasa, pengunduhan, verifikasi (sha256), serta praprosesnya dilakukan dengan skrip yang dapat dilacak. Untuk memastikan perbandingan lintas-model yang adil, semua workspace (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) berbagi produk data dan pemetaan bin yang sepenuhnya sama.


3.1 Kurva Rotasi (RC, SPARC)

Data RC berasal dari Rotmod_LTG dalam basis data SPARC (175 berkas rotmod). Setelah praproses, sampel yang masuk ke pemodelan proyek ini mencakup 104 galaksi, total 2295 titik data (r, V_obs), dan dibagi menjadi 20 RC-bin menurut aturan seperti massa bintang. Setiap titik data memuat radius r (kpc), kecepatan teramati V_obs (km/s) dan galat σ_obs, serta kecepatan komponen gas/disk/bulge (V_gas, V_disk, V_bul).


3.2 Pelensaan Lemah (GGL, KiDS-1000 / Brouwer+2021)

Data GGL menggunakan kerapatan permukaan ekuivalen ΔΣ(R) pada Gambar 3 dari Brouwer dkk. (2021) untuk KiDS-1000 (4 bin massa bintang, 15 titik R per bin), beserta kovarians lengkap yang mereka sediakan. Dalam alur rekayasa, kovarians long-form asli dibangun ulang menjadi matriks 15×15 untuk setiap bin, lalu pada audit Stage-B diverifikasi kewajaran dimensi dan nilainya.


3.3 Pemetaan RC-bin → GGL-bin dan Jumlah Sampel Total

Keempat bin massa GGL dihubungkan dengan 20 bin RC melalui pemetaan tetap: setiap GGL-bin bersesuaian dengan 5 RC-bin, dan kontribusi RC-bin dirata-ratakan secara berbobot menurut jumlah galaksi. Pemetaan ini tidak berubah di semua model dan menjadi kendala inti bagi perbandingan yang adil dalam uji penutupan dan pencocokan gabungan. Jumlah akhir titik data gabungan adalah n_total = 2355 (RC=2295, GGL=60).

4 Model dan Metode Statistik


4.1 Norma Matematis Minimal EFT dan DM (dapat diaudit/dapat diuji)

Bagian ini memberikan spesifikasi matematis minimal yang dapat dipetakan langsung ke implementasi.

(a) Model Kurva Rotasi (RC)

Untuk setiap titik data RC (r, V_obs, σ_obs), kami menggunakan penjumlahan komponen: V_mod²(r) = V_bar²(r) + V_extra²(r). Di sini V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Pada hasil utama makalah ini digunakan Υ_d = Υ_b = 0.5 (selaras dengan rekomendasi empiris SPARC; juga membantu mengurangi derajat kebebasan yang tidak perlu).

(b) Koreksi Gravitasi Rerata EFT (EFT)

Suku tambahan EFT diparameterisasi dalam bentuk “kuadrat kecepatan rerata”: V_extra²(r) = V0_bin² · f(r/ℓ). Di sini V0_bin adalah parameter amplitudo untuk setiap RC-bin (20 buah), ℓ adalah skala global (1 buah), dan f(x) adalah fungsi bentuk kernel tak berdimensi. Bentuk kernel yang dibandingkan dalam makalah ini (semuanya tanpa derajat kebebasan kontinu tambahan) adalah:

Motivasi fisik (diperluas): EFT memahami respons gravitasi tambahan pada skala galaksi sebagai respons efektif setelah pengkasaran/skala-rata atas proses yang lebih mikroskopis dalam skala hingga. Dalam makalah ini, kami tidak mengandaikan satu mekanisme mikroskopis tertentu, melainkan memakai parameterisasi minimal dan dapat diaudit untuk melakukan perbandingan serta pengujian terkendali di bawah protokol statistik terpadu.

Agar lebih intuitif, suku tambahan dapat ditulis dalam bentuk percepatan: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Ketika r≫ℓ, f→1 dan V_extra→V0_bin, sehingga muncul kontribusi kecepatan tambahan yang mendekati datar di wilayah luar; ketika r≪ℓ dan f(x)≈x, dapat diperkenalkan skala percepatan khas a0,bin≈V0_bin²/ℓ (berbeda oleh faktor kernel O(1)), yang memberi intuisi skala transisi wilayah dalam–luar yang mirip MOND.

Keluarga kernel diskret yang digunakan di sini (none/exponential/yukawa/powerlaw_tail) dapat dipandang sebagai proksi berdimensi rendah untuk berbagai “kemiringan awal / kecepatan transisi / ekor jarak jauh” (misalnya penyekatan mirip Yukawa vs respons berekor lebih panjang), digunakan untuk uji tekanan ketahanan, bukan untuk menghabiskan seluruh ruang model. Untuk bagian pelensaan lemah, kami membangun massa dan kerapatan selubung ekuivalen dari V_avg(r), lalu memproyeksikannya untuk memperoleh ΔΣ(R); kerapatan ekuivalen ini harus dipahami sebagai deskripsi efektif terhadap potensial pelensaan di bawah asumsi pemetaan medan lemah bersimetri bola (rincian lengkap dipindahkan ke Lampiran A).

Semua bentuk kernel di atas memenuhi f(x)→1 ketika x→∞ (yakni V_extra²→V0² jenuh), sementara untuk x≪1 memberi pertumbuhan linear atau sublinear: misalnya exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Karena itu, bentuk kernel yang berbeda memiliki perbedaan teramati pada “kemiringan awal” di radius kecil, laju transisi, dan ekor luar, yang dapat dibedakan melalui pencocokan gabungan dan uji penutupan RC+GGL.

Prediksi EFT untuk ΔΣ(R) pada pelensaan lemah diperoleh dengan menurunkan massa dan kerapatan selubung dari V_avg(r), lalu melakukan integral proyeksi: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). Implementasi numerik menggunakan grid logaritmik dan memperhalusnya secara adaptif ketika terjadi anomali, agar stabilitas dan replikasi terjaga.

(c) DM_RAZOR: Garis Dasar Halo NFW untuk Materi Gelap Dingin

Pada saat yang sama, kami menegaskan bahwa DM_RAZOR hanya mewakili garis dasar NFW yang minimal dan dapat diaudit (c–M tetap tanpa scatter; tanpa Adiabatic Contraction, core feedback, nonsferisitas, maupun suku lingkungan). Untuk mengurangi risiko “strawman baseline”, makalah ini tidak menyatakan bahwa efek-efek tersebut tidak ada; sebaliknya, efek itu dimasukkan dengan cara berdimensi rendah dan dapat diaudit ke dalam Lampiran B (P1A) sebagai uji tekanan, termasuk hierarkisasi c–M scatter, proksi core, dan nuisance kalibrasi shear pada sisi pelensaan.


4.2 Buku Besar Model dan Perbandingan Adil (parameter bersama = definisi penutupan)

Jumlah parameter dalam himpunan perbandingan utama adalah: DM_RAZOR k=20; keluarga EFT k=21 (1 parameter tambahan adalah log ℓ global). Semua model berbagi: data RC yang sama, data GGL dan kovarians yang sama, pemetaan RC-bin→GGL-bin yang sama, suku barionik yang sama, dan konversi satuan yang sama. Selain itu, bentuk kernel (none / exponential / yukawa / powerlaw_tail) merupakan pilihan diskret, bukan parameter kontinu tambahan, sehingga model tidak memperoleh keunggulan lewat “satu derajat kebebasan ekstra”.


4.3 Likelihood, Prior, dan Sampler

Likelihood RC menggunakan Gaussian diagonal: σ_eff² = σ_obs² + σ_int²; hasil utama menetapkan σ_int=5 km/s, dan σ_int dipindai pada Run-5. Likelihood GGL menggunakan Gaussian kovarians penuh per bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Sasaran gabungan adalah logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Prior terutama berperan sebagai batas kelayakan fisik (kendala interval untuk log ℓ, log V0, log M200); ketika Υ dan σ_int dibuat bebas, digunakan prior berinformasi lemah (lihat konfigurasi implementasi dan paket rilis untuk rinciannya).

Sampler yang digunakan adalah random walk block Metropolis adaptif: setiap langkah hanya memperbarui subblok acak dalam ruang parameter untuk meningkatkan tingkat penerimaan pada dimensi tinggi, sementara panjang langkah diadaptasi ringan menurut tingkat penerimaan dalam jendela (target penerimaan sekitar 0.25). Hasil utama memakai mode quick (misalnya n_steps=800), dan setiap workspace menghasilkan trace, residual, serta plot PPC untuk audit manual dan skrip.


4.4 Uji Penutupan dan Kontrol Negatif (definisi)

Uji penutupan (Run-2) menguji apakah posterior RC-only dapat memprediksi GGL tanpa melakukan pencocokan ulang terhadap GGL. Caranya: pada sampel posterior RC-only, ΔΣ(R) untuk 4 GGL-bin dibangkitkan secara maju dan logL_true dihitung dengan kovarians lengkap; kemudian pemetaan pengelompokan RC-bin→GGL-bin dimutasi secara acak (permutation) untuk memperoleh logL_perm. Kekuatan penutupan didefinisikan sebagai ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Selain itu, Run-10 mengelompokkan ulang 20 RC-bin secara acak menjadi 4×5 (shuffle), lalu menghitung ulang penutupan untuk menguji ketergantungan sinyal penutupan pada pemetaan yang benar.

5 Hasil Utama dan Interpretasi


5.1 Hasil Utama Pencocokan Gabungan (RC+GGL)

Best logL_total dalam pencocokan gabungan dan keunggulan relatif ΔlogL_total (relatif terhadap DM_RAZOR) ditampilkan pada Tabel S1a dan Gambar S4. Dalam himpunan perbandingan utama, EFT_BIN memiliki keunggulan gabungan terbesar (ΔlogL_total=1337.210), sementara bentuk kernel EFT lainnya juga mempertahankan keunggulan besar (1154.827–1294.442). Pada kriteria informasi (AICc/BIC), keluarga EFT juga jauh lebih baik daripada DM_RAZOR, yang menunjukkan bahwa keunggulan tersebut bukan akibat bias jumlah parameter.

Catatan: kontribusi utama ΔlogL_total≈1337 berasal dari suku RC (dalam dekomposisi joint, ΔlogL_RC≈1065, sekitar 80%); ini dapat dipahami sebagai perbaikan moderat per titik, Δχ²≈0.90, pada N=2295 titik data RC yang secara alami terakumulasi menjadi keunggulan orde 10^3 di bawah likelihood Gaussian diagonal. Pada saat yang sama, GGL dan uji penutupan menyediakan kendala lintas-dataset yang independen, dan peringkatnya tetap stabil di bawah uji tekanan σ_int, R_min, dan cov-shrink (lihat Bagian 6 dan Tabel S1b).


5.2 Hasil Uji Penutupan (RC-only → GGL)

Besaran kunci uji penutupan, ΔlogL_closure, ditampilkan pada Tabel S1b dan Gambar S3. Kekuatan penutupan keluarga EFT berada pada 171.977–280.513, lebih tinggi daripada 126.678 pada DM_RAZOR. Artinya, tanpa mengizinkan derajat kebebasan lintas-data tambahan apa pun, sampel posterior EFT dari data RC memiliki kemampuan prediksi yang lebih dapat dialihkan terhadap data GGL.

Kontrol negatif semakin mendukung relevansi fisik sinyal penutupan: ketika pengelompokan RC-bin→GGL-bin diacak, kekuatan penutupan EFT turun menjadi 6–15 (sedikit berbeda menurut kernel), sementara kekuatan penutupan baseline mencapai 172–281. “Keruntuhan sinyal” ini menyingkirkan keunggulan palsu yang dapat muncul dari implementasi numerik, kesalahan satuan, atau penanganan kovarians yang tidak tepat.

Gambar R1 | Kontrol negatif: setelah pengelompokan shuffle, sinyal penutupan turun secara signifikan (digambar berdasarkan indikator Tab_Z1).


5.3 Makna dan Batasan Hasil

Kesimpulan studi ini adalah: “pada dataset dan protokol ini, koreksi gravitasi rerata EFT mengungguli garis dasar DM_RAZOR yang diuji.” Perlu ditekankan bahwa sisi DM hanya menggunakan garis dasar NFW minimal dan relasi c(M) tetap, tanpa memasukkan core, nonsferisitas, suku lingkungan, atau model koneksi galaksi–halo yang lebih kompleks. Karena itu, naskah ini tidak mengklaim menyingkirkan seluruh keluarga model DM; ia menyediakan garis dasar pembanding yang dapat direplikasi dan berpusat pada uji penutupan untuk menilai apakah RC dan GGL dapat dijelaskan secara konsisten oleh parameter serta pemetaan lintas-data yang sama.

Untuk menanggapi pertanyaan umum tersebut, kami menyelesaikan proyek ekstensi independen P1A (lihat Lampiran B). Tanpa mengubah pemetaan bersama RC-bin→GGL-bin maupun kerangka audit, proyek ini memperkuat garis dasar DM secara “terstandar dan dapat diaudit”: selain tiga penguatan satu-parameter (SCAT/AC/FB), ditambahkan (i) hierarchical c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) proksi core baryonic-feedback satu-parameter (DM_CORE1P), serta (iii) nuisance kalibrasi shear m pada sisi pelensaan lemah (DM_RAZOR_M), lalu diberikan model gabungan DM_STD; EFT_BIN tetap dipertahankan sebagai acuan kontrol.

• DM_RAZOR_SCAT (c–M scatter) — memperkenalkan parameter dispersi konsentrasi halo-to-halo, σ_logc, untuk menguji apakah “c(M) tetap” secara sistematis meremehkan kemampuan penjelasan DM;
• DM_RAZOR_AC (Adiabatic Contraction) — menggunakan satu parameter α_AC untuk menginterpolasi secara kontinu antara “tanpa kontraksi ↔ kontraksi standar”, sehingga kecenderungan kontraksi wilayah dalam akibat barion dapat ditangkap dengan biaya minimal;
• DM_RAZOR_FB (Feedback / core) — menggunakan skala core (misalnya log r_core) untuk mendeskripsikan efek peredaman core wilayah dalam terhadap kurva rotasi, sambil mempertahankan pendekatan NFW pada skala pelensaan lemah.

Scoreboard kuantitatif P1A ditampilkan pada Tabel B1 / Gambar B1 di Lampiran B (dihasilkan otomatis dari Tab_S1_P1A_scoreboard). Pada indikator penutupan, DM_RAZOR_FB memberi kenaikan bersih kecil (122.21→129.45, +7.25), sedangkan penguatan lain tidak memberi kontribusi signifikan atau bernilai negatif pada kekuatan penutupan; pada sisi pencocokan gabungan, penambahan hierarchical c–M scatter prior (DM_HIER_CMSCAT) atau model gabungan (DM_STD) dapat memperbaiki joint logL secara signifikan, tetapi tidak meningkatkan kekuatan penutupan. Ini mengisyaratkan bahwa yang terutama bertambah adalah fleksibilitas pencocokan gabungan, bukan keteralihan lintas-probe. Karena itu, inti kesimpulan teks utama harus dipahami sebagai berikut: di bawah kendala pemetaan bersama yang ketat dan uji penutupan, keunggulan konsistensi lintas-data EFT bukan berasal dari pemilihan “garis dasar terlalu lemah” pada sisi DM. Paket rilis P1A untuk Lampiran B (tabel/gambar tambahan dan full_fit_runpack) akan dimasukkan sebagai berkas tambahan ke Concept DOI Zenodo yang sama dengan full_fit_runpack makalah ini: https://doi.org/10.5281/zenodo.18526286.

6 Ketahanan dan Eksperimen Kontrol


6.1 Pemindaian σ_int (Run-5)

Kami melakukan pemindaian sistematis terhadap dispersi intrinsik RC, σ_int, dan pada setiap nilai σ_int mengulangi inferensi gabungan untuk menghitung ΔlogL_total relatif terhadap DM_RAZOR. Nilai minimum/maksimum ΔlogL_total setiap model dalam rentang pemindaian ditampilkan pada Tabel S1b.

Gambar R2 | Rentang ΔlogL_total pada pemindaian σ_int (semakin besar semakin baik).


6.2 Pemindaian R_min (Run-6)

Untuk menguji pengaruh galat sistematik data wilayah pusat (misalnya gerak non-sirkular, resolusi, dan pemodelan barion yang belum memadai), kami memangkas data RC dengan ambang R_min dan mengulangi inferensi gabungan. Keunggulan keluarga EFT tetap positif dan stabil dalam orde besar pada pemindaian R_min.

Gambar R3 | Rentang ΔlogL_total pada pemindaian R_min (semakin besar semakin baik).


6.3 Pemindaian cov-shrink (Run-7)

Untuk menguji ketidakpastian kovarians GGL, kami menerapkan shrinkage pada matriks kovarians setiap bin massa: C_α=(1−α)C+α·diag(C), lalu memindai α. Hasilnya menunjukkan bahwa keunggulan keluarga EFT tidak sensitif terhadap perlakuan ini.

Gambar R4 | Rentang ΔlogL_total pada pemindaian cov-shrink (semakin besar semakin baik).


6.4 Tangga Ablasi (Run-8)

Di dalam EFT_BIN, kami melakukan ablasi bertingkat secara bersarang: dari model paling sederhana (tanpa parameter bebas), ke model yang hanya mempertahankan sedikit derajat kebebasan, lalu ke model lengkap dengan amplitudo 20-bin + skala global. AICc/BIC menunjukkan bahwa EFT_BIN lengkap memang sangat diperlukan untuk menjelaskan data.

Gambar R5 | Tangga ablasi EFT_BIN (AICc, semakin kecil semakin baik).


6.5 Prediksi Leave-out (Run-9)

Kami juga menjalankan uji leave-one-bin-out (LOO): dari 4 bin massa GGL, satu bin ditahan pada setiap putaran; bin lainnya (bersama seluruh RC) digunakan untuk inferensi ulang, lalu log-likelihood uji dievaluasi pada bin yang ditahan. Indikator ringkasan tersedia pada tabel tambahan Tab_R3_leave_one_bin_out (produk Run-9; pola jalur berkas diberikan dalam daftar produk kunci Bagian 8.2), dan keluarga EFT masih jelas mengungguli DM_RAZOR bahkan pada kasus leave-out terburuk.

Gambar R6 | LOO: distribusi log-likelihood pada bin yang ditahan (dari produk Run-9).


6.6 Kontrol Negatif: RC-bin shuffle (Run-10)

Run-10 mengelompokkan ulang 20 RC-bin secara acak menjadi 4×5, lalu menghitung ulang penutupan sambil mempertahankan posterior RC-only yang tidak berubah. Hasilnya menunjukkan bahwa, dibandingkan pemetaan asli, shuffle secara signifikan menurunkan mean logL_true dan ΔlogL_closure penutupan (lihat Tabel S1b dan Gambar R1), sehingga kembali mendukung keterjelasan fisik sinyal penutupan.

Gambar R7 | Kontrol negatif: pemetaan shuffle menyebabkan mean logL_true penutupan turun jelas (dari produk Run-10).

7 Keterlacakan dan Audit Konsistensi (Provenance)

Semua angka yang dikutip dalam makalah ini dapat dilacak butir demi butir dalam tabel ringkasan ketat dan catatan audit yang diarsipkan untuk rilis. Agar teks utama lebih lancar dibaca, rantai keterlacakan lengkap (daftar tag, tabel audit, daftar checksum, dan cara pemeriksaan) dipindahkan ke Lampiran A.

8 Reproduksibilitas dan Arsip Zenodo (Reproducibility & Archive)

Pernyataan ketersediaan data dan kode: data kurva rotasi SPARC dan pelensaan lemah KiDS-1000 yang digunakan dalam makalah ini adalah data publik. Laporan layak terbit telah diarsipkan di Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), dan paket replikasi lengkap telah diarsipkan di Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Langkah eksekusi rinci, lingkungan dependensi, daftar arsip, dan informasi verifikasi hash diberikan dalam Lampiran A; desain, tag run, dan keluaran uji tekanan standardisasi garis dasar DM (P1A) diberikan dalam Lampiran B.

Di bawah Concept DOI paket replikasi lengkap yang sama (https://doi.org/10.5281/zenodo.18526286), kami menyediakan dua pintu masuk replikasi menurut kegunaan:
• P1 (teks utama) full_fit_runpack: mereplikasi RC-only / closure / joint dan pemindaian ketahanan EFT vs DM_RAZOR, serta menghasilkan aset teks utama seperti Tabel S1a/S1b dan Gambar S3/S4;
• P1A (Lampiran B) full_fit_runpack: mereplikasi uji tekanan standardisasi garis dasar DM (SCAT/AC/FB + hierarchical c–M scatter prior + core1p + lensing m + DM_STD; termasuk kontrol EFT_BIN), serta menghasilkan Tabel B1 dan Gambar B1 lampiran.
Tabel/gambar tambahan P1A dan full_fit_runpack akan dimasukkan sebagai berkas tambahan ke Concept DOI yang sama, agar pintu arsip tetap tunggal.

9 Ucapan Terima Kasih dan Pernyataan


9.1 Ucapan Terima Kasih

Kami berterima kasih kepada tim SPARC dan KiDS-1000 atas data serta dokumentasi publik yang mereka sediakan; kami juga berterima kasih kepada para peserta dalam proses rekonstruksi dan audit proyek ini.


9.2 Kontribusi Penulis

Guanglin Tu bertanggung jawab atas pengusulan konsep, desain skema, implementasi rekayasa, pengolahan data, analisis formal, implementasi alur replikasi dan audit, serta penulisan makalah ini.


9.3 Sumber Dana

Pendanaan pribadi oleh penulis Guanglin Tu (tanpa pendanaan eksternal / tanpa nomor hibah).


9.4 Kepentingan yang Bersaing

Penulis Guanglin Tu memiliki hubungan dengan “Kelompok Kerja EFT, Shenzhen Energy Filament Science Research Co., Ltd. (Tiongkok)”; tidak ada kepentingan bersaing lainnya.


9.5 Bantuan AI

OpenAI GPT-5.2 Pro dan Gemini 3 Pro digunakan untuk penyuntingan bahasa, penyuntingan terstruktur, dan perapian alur replikasi; tidak digunakan untuk menghasilkan atau mengubah data, hasil, gambar, tabel, maupun kode; tidak digunakan untuk menghasilkan sitasi; penulis memikul tanggung jawab penuh atas isi teks dan ketepatan sitasi.

10 Referensi

Lampiran A: Rincian Keterlacakan dan Reproduksibilitas

Lampiran ini merangkum informasi keterlacakan dan reproduksibilitas untuk arsip jangka panjang (tag run, hasil audit, daftar arsip, titik pemeriksaan utama, dan sebagainya), sehingga pembaca dapat memeriksa dan mereplikasi sesuai kebutuhan.


A.1 Rincian Keterlacakan dan Audit

Untuk memastikan keterlacakan jangka panjang, proyek ini memberi tag timestamp pada setiap run dan output, serta mempertahankan produk historis tanpa menimpanya. Angka inti yang dikutip dalam naskah ini berasal dari ringkasan ketat (compile_tag=20260205_035929) dan telah melewati audit konsistensi berikut:

• Semua tabel tahap antara memuat run_tag dan tag tahap; skrip ringkasan ketat memilih sumber tabel canonical yang “lengkap dan konsisten” dari report/tables.

• Nilai dalam Tab_Z1_master_summary dan Tab_Z2_conclusion_highlights dibandingkan butir demi butir dengan tabel canonical yang dipilih.

• Saat PDF dibuat, audit tag dilakukan terhadap “tag tabel/gambar yang dikutip” untuk memastikan tidak ada pencampuran produk lama.

Tag kunci (untuk melokalisasi semua produk antara): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Hasil audit konsistensi: Tab_AUDIT_checks_strict menunjukkan pass=9, fail=0, skip=0 (lihat paket rilis untuk rinciannya).


A.2 Langkah Eksekusi Reproduksibilitas dan Daftar Arsip

Studi ini menggunakan sistem replikasi berupa “laporan layak terbit + bahan tambahan tabel/gambar + paket run yang dapat dijalankan ulang sepenuhnya”: pembaca dapat langsung memeriksa Tables & Figures Supplement untuk mencocokkan semua aset tabel/gambar yang dikutip dalam makalah ini; bila perlu mereplikasi angka dan rantai audit dari nol, pembaca dapat menggunakan full_fit_runpack untuk mengunduh data dan menjalankan ulang seluruh alur (setelah selesai, skrip pembanding tabel reference di dalam paket dapat digunakan untuk memverifikasi konsistensi nilai tabel).


A.2.1 Quickstart Replikasi (RUN_FULL, Windows PowerShell)

Bagian ini memberikan jalur replikasi yang lebih singkat (Windows PowerShell). Untuk pemeriksaan cepat, disarankan langsung membaca Tables & Figures Supplement agar setiap tabel dan gambar yang dikutip dapat dicocokkan. Jika diperlukan replikasi end-to-end dan pembuatan seluruh tabel/gambar serta produk audit, gunakan full_fit_runpack: jalankan verify_checksums.ps1 dan RUN_FULL.ps1 sesuai README/ONE_PAGE_REPRO_CHECKLIST dalam paket (Mode=full disarankan).

Pintu masuk arsip Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Tag rantai utama makalah ini: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag: 20260205_112442.


A.2.2 Bahan Arsip dan Titik Pemeriksaan Kunci (Packages & checks)

Arsip Zenodo menyediakan 3 jenis bahan yang saling melengkapi: (1) laporan layak terbit (makalah ini, v1.1; termasuk Lampiran B: uji tekanan standardisasi garis dasar DM P1A); (2) Tables & Figures Supplement (bahan tambahan tabel dan gambar: mencakup semua aset tabel/gambar yang dikutip dalam makalah ini; masing-masing untuk P1 dan P1A); (3) full_fit_runpack (paket replikasi lengkap: mengunduh data dari nol dan menjalankan ulang seluruh alur; masing-masing untuk P1 dan P1A). Di antaranya, (1)–(2) mendukung pembacaan cepat dan pemeriksaan independen, sementara (3) menyediakan kemampuan replikasi end-to-end penuh.

Kategori bahan

Nama berkas (contoh)

Kegunaan dan posisi (urutan penggunaan yang disarankan)

Laporan layak terbit (Tionghoa dan Inggris)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Laporan lengkap yang diarsipkan di Zenodo; teks utama memberikan kesimpulan utama dan audit ketahanan, sedangkan Lampiran B memberikan P1A (uji tekanan standardisasi garis dasar DM).

Tables & Figures Supplement(P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Semua tabel (CSV) dan gambar (PNG) yang dikutip dalam teks utama, termasuk skrip pembuat dan berkas tag.

Tables & Figures Supplement(P1A)

P1A_supplement_figs_tables_v1.zip

Semua tabel dan gambar yang dikutip dalam Lampiran B (P1A), termasuk Tab_S1_P1A_scoreboard dan Fig_S1_P1A_scoreboard.

full_fit_runpack(P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

Replikasi end-to-end lengkap: mengunduh data dari nol dan menjalankan ulang RC-only/closure/joint serta pemindaian ketahanan.

full_fit_runpack(P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

Replikasi end-to-end lengkap (Lampiran B): menjalankan ulang DM 7+1 + DM_STD (termasuk kontrol EFT_BIN) dan menghasilkan aset lampiran; paket memuat skrip pembanding tabel reference untuk memverifikasi konsistensi nilai tabel.

Saran sitasi: ketika mengutip makalah ini atau bahan replikasi yang menyertainya, mohon cantumkan Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

Produk kunci yang harus muncul dan dapat dibandingkan setelah replikasi meliputi:

Lampiran B: P1A — Uji Tekanan Standardisasi Garis Dasar DM (DM 7+1 + DM_STD; termasuk kontrol EFT)

Lampiran ini mencatat proyek ekstensi “uji tekanan standardisasi garis dasar DM” (P1A) yang konsisten dengan protokol penutupan teks utama. Posisinya adalah: tanpa memperkenalkan banyak derajat kebebasan dan tanpa mengubah pemetaan bersama RC-bin→GGL-bin maupun kerangka audit, garis dasar minimal DM_RAZOR yang digunakan dalam teks utama (NFW + c–M tetap, tanpa scatter / tanpa contraction / tanpa core) dinaikkan menjadi kumpulan garis dasar DM yang lebih dekat dengan praktik astrofisika dan lebih tahan terhadap keberatan umum. P1A mencakup sekaligus meluaskan uji tekanan tiga cabang sebelumnya: sambil mempertahankan SCAT/AC/FB, ia menambahkan hierarchical c–M scatter + prior, proksi core satu-parameter, dan nuisance m untuk kalibrasi shear pada sisi pelensaan, serta menyediakan model gabungan DM_STD; EFT_BIN tetap dipertahankan sebagai acuan kontrol.

Penjelasan tambahan: kekuatan penutupan dan angka lain dalam Lampiran B (P1A) dihitung dengan anggaran Monte Carlo yang lebih tinggi (misalnya ndraw=400, nperm=24), berbeda dari anggaran quick pada teks utama yang digunakan untuk mencakup keluarga kernel EFT lengkap (misalnya ndraw=60, nperm=12). Karena itu, nilai absolut mungkin mengalami drift sampling berorde O(10); namun perbandingan antarmodel di bawah anggaran yang sama dan dalam tabel yang sama tetap adil, sedangkan tanda dan orde besar keunggulan tetap stabil pada berbagai anggaran.


B.1 Tujuan dan Penentuan Posisi (Why P1A, and why as an Appendix)

P1A tidak berupaya menghabiskan semua kemungkinan pemodelan halo ΛCDM (misalnya nonsferisitas, ketergantungan lingkungan, koneksi galaksi–halo yang kompleks, atau baryon physics berdimensi tinggi). Sebaliknya, P1A mengikuti prinsip “berdimensi rendah, dapat diaudit, dapat direplikasi”: setiap modul penguatan hanya memperkenalkan ≤1 parameter efektif kunci dan tetap tunduk pada tiga kendala keras makalah ini:
(i) Buku besar parameter: parameter baru harus dicatat secara eksplisit dan dilaporkan bersama kriteria informasi (AICc/BIC);
(ii) Pemetaan bersama: pemetaan pengelompokan RC-bin→GGL-bin yang sama tetap digunakan; tidak boleh “menyetel pemetaan” secara terpisah untuk satu dataset;
(iii) Uji penutupan: setiap penguatan harus menunjukkan peningkatan nyata pada prediksi yang dapat dialihkan RC→GGL, bukan hanya memperbaiki pencocokan RC-only.


B.2 DM 7+1 + DM_STD: Definisi Modul, Parameter, dan Cara Masuk ke Posterior Gabungan

Sebagai runpack independen, P1A menyediakan 8 workspace DM (DM 7+1) dan 1 kontrol EFT: dengan DM_RAZOR sebagai baseline, dibangun tiga penguatan legacy satu-parameter (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), lalu ditambahkan tiga modul defensif yang lebih standar (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), dan akhirnya diberikan model gabungan DM_STD. Tujuan bersama modul-modul ini adalah, dengan sebisa mungkin tidak menambah dimensi, mencakup tiga kelas keberatan yang paling umum: (a) bagaimana dispersi dan prior relasi c–M masuk ke model hierarkis; (b) apakah efek utama baryonic feedback dapat diwakili oleh proksi core satu-parameter; (c) apakah galat sistematik kunci pada sisi pelensaan dapat keliru dianggap sebagai sinyal fisik.

Workspace

dm_model

Parameter baru (≤1)

Motivasi fisik (inti)

Prinsip implementasi (ramah audit)

DM_RAZOR

NFW (fixed c–M, no scatter)

Garis dasar halo ΛCDM yang minimal dan dapat diaudit; digunakan untuk perbandingan ketat dengan EFT

Pemetaan bersama tetap; catatan parameter ketat; sebagai baseline hanya untuk perbandingan relatif

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

Relasi c–M memiliki dispersi; didekati dengan log-normal scatter satu-parameter

≤1 parameter baru; tetap memakai pemetaan bersama; kenaikan penutupan menjadi kriteria penerimaan

DM_RAZOR_AC

NFW + Adiabatic Contraction (legacy)

α_AC

Infall barion dapat memicu kontraksi adiabatik halo; didekati dengan satu parameter intensitas

≤1 parameter baru; pemetaan tidak diubah; perubahan AICc/BIC dan kenaikan penutupan dilaporkan

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedback dapat membentuk core di wilayah dalam; didekati dengan satu skala core

≤1 parameter baru; penutupan/kontrol negatif memakai protokol yang sama; perbaikan RC-only bukan satu-satunya target

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

Hierarkisasi c_i∼logN(c(M_i),σ_logc) yang lebih standar; sekaligus memengaruhi posterior gabungan RC dan GGL

Prior eksplisit; latent c_i dimarginalkan; tetap berdimensi rendah dan dapat diaudit

DM_CORE1P

Proksi core 1-parameter (terinspirasi coreNFW/DC14)

log r_core

Efek utama baryonic feedback diwakili oleh proksi core satu-parameter, tanpa rincian pembentukan bintang berdimensi tinggi

Mengutip literatur standar; ≤1 parameter baru; terikat pada uji penutupan

DM_RAZOR_M

NFW + nuisance kalibrasi shear pelensaan

m_shear (GGL)

Sistematika kunci pada sisi pelensaan lemah diserap sebagai parameter efektif, sehingga risiko “sistematika dianggap fisika” berkurang

nuisance dicatat eksplisit; tidak boleh memengaruhi RC secara balik; hasil terutama dinilai dari ketahanan penutupan

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Tiga kelas keberatan paling umum dimasukkan sekaligus ke garis dasar standar yang tetap berdimensi rendah

Buku besar parameter dan kriteria informasi dilaporkan bersama; penutupan menjadi indikator utama; digunakan sebagai kontrol defensif DM terkuat

Catatan: penamaan parameter mengikuti implementasi rekayasa (misalnya σ_logc, α_AC, log r_core, m_shear). Fokus desain P1A adalah “membuat garis dasar DM sedikit lebih kuat, tetapi tetap dapat diaudit”, bukan mengubah sisi DM menjadi pencocok berdimensi tinggi yang tidak terkendali. Secara khusus, DM_HIER_CMSCAT memperkenalkan c–M scatter secara hierarkis: konsentrasi c_i untuk setiap halo diberi dispersi log-normal di sekitar c(M_i), lalu dibatasi oleh σ_logc global dan prior c(M); struktur hierarkis ini memengaruhi posterior gabungan RC dan GGL sekaligus.


B.3 Protokol Statistik dan Format Produk yang Konsisten dengan Teks Utama

P1A menggunakan ulang seluruh produk data, pemetaan bersama, dan kerangka audit dari teks utama; urutan eksekusi dan format produknya tetap konsisten:
(1) Run‑1: inferensi RC-only (keluaran posterior_samples.npz dan metrics.json);
(2) Run‑2: uji penutupan RC→GGL (keluaran closure_summary.json dan permuted baseline);
(3) Run‑3: pencocokan gabungan RC+GGL (keluaran joint_summary.json).
Semua angka yang dikutip berasal dari tabel ringkasan otomatis (Tab_S1_P1A_scoreboard) dan dapat diverifikasi setelah menjalankan ulang seluruh alur P1A full_fit_runpack dengan skrip pembanding tabel reference yang sudah disertakan.


B.4 Hasil Utama, Pintu Masuk Tabel/Gambar, dan Rencana Arsip (DOI yang sama)

Bagian ini memberikan kesimpulan kuantitatif inti P1A. Tabel B1 merangkum indikator kunci RC-only, penutupan RC→GGL, dan pencocokan gabungan RC+GGL (angka dalam tanda kurung adalah selisih relatif terhadap baseline DM_RAZOR); kekuatan penutupan didefinisikan sebagai ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (semakin besar semakin baik). Gambar B1 memvisualisasikan scoreboard yang sama. Pokok kesimpulannya:
• Di antara tiga cabang legacy, hanya DM_RAZOR_FB (feedback/core) yang memberi kenaikan bersih kecil pada kekuatan penutupan: 122.21→129.45 (+7.25); SCAT dan AC tidak memberi kenaikan bersih;
• Modul baru DM_HIER_CMSCAT dan DM_RAZOR_M hampir tidak memengaruhi kekuatan penutupan (~0), dan DM_CORE1P juga tidak menunjukkan kenaikan bersih yang signifikan;
• Model gabungan DM_STD dapat memperbaiki joint logL secara substansial (lebih dekat ke optimum pencocokan gabungan), tetapi kekuatan penutupannya justru turun. Ini menunjukkan bahwa peningkatan utamanya berasal dari fleksibilitas pencocokan gabungan, bukan dari keteralihan lintas-probe;
• EFT_BIN sebagai kontrol tetap mempertahankan keunggulan yang jelas dalam kekuatan penutupan dan pencocokan gabungan, sehingga kesimpulan utama teks robust terhadap pengenalan “garis dasar DM yang lebih kuat + nuisance pelensaan”.

Agar mudah dibandingkan langsung dengan perbandingan utama dalam teks, Tab S1a–S1b merangkum hasil ketat keluarga EFT dan DM_RAZOR: model EFT meningkatkan ΔlogL_total≈1155–1337 relatif terhadap DM_RAZOR dalam pencocokan gabungan, dan mencapai ΔlogL_closure=172–281 dalam uji penutupan. P1A hanya membuat sisi DM menjadi “lawan pembanding yang lebih sulit”; fungsinya adalah melemahkan keberatan seperti “strawman baseline / systematics-as-physics”, bukan menggantikan perbandingan utama teks.

Tabel B1 | Scoreboard P1A (semakin besar semakin baik; angka dalam kurung adalah selisih relatif terhadap baseline DM_RAZOR).

Cabang model (workspace)

Δk

RC-only best logL_RC (Δ)

Kekuatan penutupan ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Gambar B1 | Scoreboard P1A: ΔlogL penutupan dan gabungan relatif terhadap baseline (semakin besar semakin baik).

Satu set contoh tag run yang sudah selesai untuk lampiran ini adalah sebagai berikut (untuk melokalisasi produk antara dan tabel/gambar P1A):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 Cara Sitasi yang Disarankan (Appendix citation note)

Jika pembaca perlu mengutip “uji tekanan standardisasi garis dasar DM” secara terpisah dari kesimpulan utama teks, disarankan untuk mencantumkan bersama kesimpulan utama: ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’