
우주 지도를 만드는 망원경이 데이터를 '즉시 공개'한다면, 그게 오히려 과학의 발전을 늦추는 건 아닐까요? 저는 학부 시절 이 질문을 진지하게 고민했던 적이 있습니다. 당시 WISE 데이터를 붙들고 성간 물질 밀도 모델링을 하던 저는, 데이터가 너무 제한적이어서 논문 한 편에 수개월을 쏟아야 했거든요. 그 경험이 있었기에, SPHEREx가 전천 데이터를 매주 단위로 공개한다는 소식을 처음 들었을 때 솔직히 믿기지 않았습니다.
오픈사이언스: 데이터 공개가 과학을 바꾸는 방식
SPHEREx는 2025년 3월 발사 이후 현재 저궤도(LEO)에서 전천 탐사를 수행 중입니다. 여기서 LEO란 고도 약 400~ 2,000km 사이의 지구 저궤도를 뜻하며, 대기 저항의 영향을 받는 대신 발사 비용이 낮고 통신 지연이 짧다는 특성이 있습니다.
이 위성이 수집한 관측 원시 데이터는 60일 이내에 보정을 마치고 IRSA(NASA/IPAC 적외선 과학 아카이브)를 통해 매주 전면 공개됩니다. 과거 대형 우주 미션들이 PI(수석 연구원) 그룹에 6개월에서 1년 이상의 독점 기간을 부여했던 관행과 비교하면 이건 분명히 혁신적인 변화입니다. 저도 처음엔 "이렇게 빨리 공개하면 데이터 품질 검증이 부실한 것 아닌가"라고 의심했습니다만, 실제로 아카이브에 올라온 FITS 파일을 열어보니 WCS 정렬과 디텍터 효과 보정이 상당한 수준으로 이루어져 있었습니다. 여기서 WCS(World Coordinate System)란 이미지 픽셀 좌표를 실제 천구 좌표계로 변환해주는 정렬 정보를 의미하며, 이게 틀어지면 다른 망원경 데이터와의 교차 검증 자체가 불가능해집니다.
오픈 사이언스 패러다임을 지지하는 분들은 데이터 공개 속도만큼 과학 발견도 빨라진다고 말합니다. 저는 여기에 동의하면서도, 한 가지를 덧붙이고 싶습니다. 데이터 처리 프로시저를 함께 공개한다는 점이 핵심입니다. 누구나 독립적으로 재현성 검증(Reproducibility)을 할 수 있다는 것, 즉 다른 연구자가 동일한 절차로 동일한 결과를 얻을 수 있다는 것이 SPHEREx 아카이브 정책이 단순한 '공개'를 넘어서는 이유입니다 (출처: NASA 오픈사이언스).
SPHEREx 데이터가 과학 공동체에 가져올 변화를 정리하면 다음과 같습니다.
• JWST의 정밀 분광 관측 대상을 사전에 선별하는 파인더로 활용 가능
• TESS의 외계행성 파라미터를 적외선 측광 데이터로 정밀하게 보완
• ESA 유클리드(Euclid) 및 낸시 그레이스 로만 우주망원경과 결합한 암흑 에너지 연구에 활용
초분광 데이터 큐브: WISE와의 결정적 차이
제가 대학원 시절 가장 힘들었던 작업 중 하나가 바로 WISE의 광도 측정 데이터에서 유기 화합물의 분자선 흡수 구조를 분리해내는 것이었습니다. WISE는 W1부터 W4까지 단 4개의 광대역 필터만 제공했기 때문에, 연속 스펙트럼(Continuum) 위에 살짝 얹혀 있는 분자 흡수선 구조를 잡아내려면 수십 종의 이론적 격자 모델을 돌리며 피팅 오차와 씨름해야 했습니다. 그 과정이 얼마나 소모적이었는지, 지금도 그 FITS 파일들을 보면 눈이 아플 정도입니다.
SPHEREx는 이 문제를 근본적으로 다른 방식으로 접근합니다. LVF(선형 가변 필터, Linear Variable Filter)를 센서에 직접 부착하여 0.75~5.0μm 파장 대역에서 102개의 채널로 전천을 분광합니다. 여기서 LVF란 필터의 위치에 따라 투과 파장이 연속적으로 변하는 광학 소자로, 무거운 회절 격자 분광기 없이도 대면적 분광이 가능하게 해주는 장치입니다. 덕분에 전천의 모든 픽셀에 대해 3차원 데이터 큐브, 즉 공간 두 축에 파장 축을 더한 스펙트럼 이미지를 통째로 얻을 수 있습니다.
제가 처음 이 데이터 큐브를 열었을 때의 감각은 솔직히 설명하기 어렵습니다. 과거엔 추정에만 의존해야 했던 성간 얼음(Interstellar Ice)의 분자 지문, 즉 물 분자나 이산화탄소의 흡수선이 선명하게 스펙트럼 위에 찍혀 있는 걸 보는 순간, 데이터 병목에 시달리던 시간들이 한꺼번에 보상받는 느낌이었습니다.
다만, 이 방식에 한계가 없다고 보는 시각도 있는데, 저는 여기에 동의하지 않습니다. SPHEREx의 분광 해상도 R값은 파장 대역에 따라 약 40~ 130 수준입니다. 분광 해상도 R이란 R = λ/Δλ로 정의되며, 두 파장을 얼마나 정밀하게 분리할 수 있는지를 나타내는 지표입니다. 이 값이 낮을수록 비슷한 파장의 두 신호를 구별하기 어렵습니다. R이 40~130이라는 것은 분자의 대략적인 화학적 지문은 잡을 수 있지만, 성간 가스의 시선 속도 운동학이나 초미세 분자 전이를 해부하기엔 역부족이라는 뜻입니다. 이런 면에서 SPHEREx는 독자적인 발견 기기라기보다 JWST 같은 대형 지향성 망원경의 타겟을 정밀하게 골라주는 도구로서의 역할이 더 크다고 봅니다 (출처: NASA/JPL SPHEREx 미션 페이지).
황도광 감산: 우주론 검증의 보이지 않는 장벽
SPHEREx의 핵심 우주론 목표 중 하나는 원시 비원성(Primordial Non-Gaussianity), 즉 fNL이라 불리는 파라미터를 측정하는 것입니다. fNL이란 우주 초기 인플레이션 단계에서 밀도 요동이 얼마나 '비정규적으로' 분포했는지를 정량화하는 값으로, 이 수치가 정밀하게 측정되면 인플레이션을 일으킨 물리 메커니즘 자체를 특정할 수 있습니다. 이를 위해서는 수억 개의 은하 3차원 분포 지도가 필요하고, SPHEREx는 그 지도를 그리기 위한 핵심 도구입니다.
문제는 황도광(Zodiacal Light)입니다. 황도광이란 태양계 내부를 떠도는 미세 먼지 입자들이 태양빛을 산란시켜 만들어내는 광학적 배경 노이즈로, 특히 근적외선 파장 대역에서 그 강도가 매우 높습니다. SPHEREx가 저궤도에서 운용된다는 특성상, 궤도 위상이 달라질 때마다 황도광의 강도와 패턴이 미묘하게 변합니다. 이 시변동 오차가 정밀하게 감산되지 않으면 우주론적 신호 자체가 배경 노이즈에 묻혀버릴 수 있습니다.
이 부분은 SPHEREx 팀이 얼마나 정교한 배경광 제거 알고리즘을 가동 중인지에 달려 있습니다. 제 경험상, 이런 종류의 체계적 오차(Systematic Error)는 발사 전 시뮬레이션에서 아무리 정밀하게 모델링해도 실제 궤도 데이터를 받아보면 예상치 못한 잔차가 남는 경우가 많습니다. IRSA 아카이브에 첨부되는 모니터링 필터 파일 내 배경광 정제 알고리즘이 지속적으로 피어 리뷰되고 고도화되어야 하는 이유가 바로 여기 있습니다. 이 한계를 인지하면서도, SPHEREx의 전체 설계가 이를 보완하기 위해 4회의 전천 반복 탐사를 계획하고 있다는 점은 긍정적으로 평가합니다.
SPHEREx가 2년 미션 기간 동안 쌓아갈 4장의 전천 초분광 지도는, ESA 유클리드 미션과 낸시 그레이스 로만 우주망원경의 암흑 에너지 데이터셋과 결합될 때 비로소 그 진가를 드러낼 것입니다. 저는 이 데이터 시너지가 단순한 기대가 아니라, 현재 가동 중인 미션들의 과학적 설계가 그렇게 되도록 의도적으로 구성되어 있다는 점에서 충분히 실현 가능한 전망이라고 봅니다.
SPHEREx 데이터가 매주 공개되는 지금, 이 데이터를 어떻게 활용하느냐는 더 이상 특정 연구팀만의 특권이 아닙니다. IRSA 아카이브에 접속해 직접 FITS 파일을 열어보는 것, 그것이 가장 정직하게 이 미션을 경험하는 방법입니다. 아직 적외선 천문학이 낯선 분이라도, 공개된 데이터 처리 프로시저를 따라가다 보면 우주의 분자 지문이라는 것이 얼마나 구체적인 숫자로 존재하는지 실감할 수 있을 것입니다.
참고: https://science.nasa.gov/open-science/spherex-universe-map/