XMM-LSS master catalogueÂ¶

This notebook presents the merge of the various pristine catalogues to produce the HELP master catalogue on XMM-LSS.

from herschelhelp_internal import git_version
print("This notebook was run with herschelhelp_internal version: \n{}".format(git_version()))

This notebook was run with herschelhelp_internal version: 
33f5ec7 (Wed Dec 6 16:56:17 2017 +0000)

%matplotlib inline
#%config InlineBackend.figure_format = 'svg'

import matplotlib.pyplot as plt
plt.rc('figure', figsize=(10, 6))

import os
import time

from astropy import units as u
from astropy.coordinates import SkyCoord
from astropy.table import Column, Table
import numpy as np
from pymoc import MOC

from herschelhelp_internal.masterlist import merge_catalogues, nb_merge_dist_plot, specz_merge
from herschelhelp_internal.utils import coords_to_hpidx, ebv, gen_help_id, inMoc

TMP_DIR = os.environ.get('TMP_DIR', "./data_tmp")
OUT_DIR = os.environ.get('OUT_DIR', "./data")
SUFFIX = os.environ.get('SUFFIX', time.strftime("_%Y%m%d"))

try:
    os.makedirs(OUT_DIR)
except FileExistsError:
    pass

I - Reading the prepared pristine cataloguesÂ¶

#candels = Table.read("{}/CANDELS.fits".format(TMP_DIR))           # 1.1
#cfht_wirds = Table.read("{}/CFHT-WIRDS.fits".format(TMP_DIR))     # 1.3
#cfhtls_wide = Table.read("{}/CFHTLS-WIDE.fits".format(TMP_DIR))   # 1.4a
#cfhtls_deep = Table.read("{}/CFHTLS-DEEP.fits".format(TMP_DIR))   # 1.4b
#We no longer use CFHTLenS as it is the same raw data set as CFHTLS-WIDE
# cfhtlens = Table.read("{}/CFHTLENS.fits".format(TMP_DIR))         # 1.5
#decals = Table.read("{}/DECaLS.fits".format(TMP_DIR))             # 1.6
#servs = Table.read("{}/SERVS.fits".format(TMP_DIR))               # 1.8
#swire = Table.read("{}/SWIRE.fits".format(TMP_DIR))               # 1.7
#hsc_wide = Table.read("{}/HSC-WIDE.fits".format(TMP_DIR))         # 1.9a
#hsc_deep = Table.read("{}/HSC-DEEP.fits".format(TMP_DIR))         # 1.9b
#hsc_udeep = Table.read("{}/HSC-UDEEP.fits".format(TMP_DIR))       # 1.9c
#ps1 = Table.read("{}/PS1.fits".format(TMP_DIR))                   # 1.10
#sxds = Table.read("{}/SXDS.fits".format(TMP_DIR))                 # 1.11
#sparcs = Table.read("{}/SpARCS.fits".format(TMP_DIR))             # 1.12
dxs = Table.read("{}/UKIDSS-DXS.fits".format(TMP_DIR))            # 1.13
uds = Table.read("{}/UKIDSS-UDS.fits".format(TMP_DIR))            # 1.14
#vipers = Table.read("{}/VIPERS.fits".format(TMP_DIR))             # 1.15
#vhs = Table.read("{}/VISTA-VHS.fits".format(TMP_DIR))             # 1.16
#video = Table.read("{}/VISTA-VIDEO.fits".format(TMP_DIR))         # 1.17
#viking = Table.read("{}/VISTA-VIKING.fits".format(TMP_DIR))       # 1.18

II - Merging tablesÂ¶

We first merge the optical catalogues and then add the infrared ones. We start with PanSTARRS because it coevrs the whole field.

At every step, we look at the distribution of the distances separating the sources from one catalogue to the other (within a maximum radius) to determine the best cross-matching radius.

Start with DXSÂ¶

master_catalogue = dxs
master_catalogue['dxs_ra'].name = 'ra'
master_catalogue['dxs_dec'].name = 'dec'

Add UDSÂ¶

nb_merge_dist_plot(
    SkyCoord(master_catalogue['ra'], master_catalogue['dec']),
    SkyCoord(uds['uds_ra'], uds['uds_dec'])
)

HELP Warning: There weren't any cross matches. The two surveys probably don't overlap.

# Given the graph above, we use 0.8 arc-second radius
master_catalogue = merge_catalogues(master_catalogue, uds, "uds_ra", "uds_dec", radius=0.8*u.arcsec)

CleaningÂ¶

When we merge the catalogues, astropy masks the non-existent values (e.g. when a row comes only from a catalogue and has no counterparts in the other, the columns from the latest are masked for that row). We indicate to use NaN for masked values for floats columns, False for flag columns and -1 for ID columns.

for col in master_catalogue.colnames:
    if "m_" in col or "merr_" in col or "f_" in col or "ferr_" in col or "stellarity" in col:
        master_catalogue[col] = master_catalogue[col].astype(float)
        master_catalogue[col].fill_value = np.nan
    elif "flag" in col:
        master_catalogue[col].fill_value = 0
    elif "id" in col:
        master_catalogue[col].fill_value = -1
        
master_catalogue = master_catalogue.filled()

#Since this is not the final merged catalogue. We rename column names to make them unique
master_catalogue['ra'].name = 'ukidss_ra'
master_catalogue['dec'].name = 'ukidss_dec'
master_catalogue['flag_merged'].name = 'ukidss_flag_merged'

master_catalogue[:10].show_in_notebook()

V - Adding unique identifierÂ¶

master_catalogue.add_column(Column(data=(np.char.array(master_catalogue['dxs_id'].astype(str)) 
                                    +  np.char.array(master_catalogue['uds_id'].astype(str) )), 
                              name="ukidss_intid"))

id_names = []
for col in master_catalogue.colnames:
    if '_id' in col:
        id_names += [col]
    if '_intid' in col:
        id_names += [col]
        
print(id_names)

['dxs_id', 'uds_id', 'ukidss_intid']

VII - Choosing between multiple values for the same filterÂ¶

VII. d UKIDSS DXS and UDSÂ¶

There is no overlap between UDS and DXS so I simply merge the two columns.

#Band H is only in UDS so we can simply rename it
for col in master_catalogue.colnames:
    if 'uds_h' in col:
        master_catalogue[col].name = col.replace('uds_h', 'ukidss_h')
        
has_uds_k =     ~np.isnan(master_catalogue['f_uds_k'])
has_uds_j =     ~np.isnan(master_catalogue['f_uds_j'])
has_ukidss_k =  ~np.isnan(master_catalogue['f_ukidss_k'])
has_ukidss_j =  ~np.isnan(master_catalogue['f_ukidss_j'])

master_catalogue['f_ukidss_k'][has_uds_k] = master_catalogue['f_uds_k'][has_uds_k]
master_catalogue['ferr_ukidss_k'][has_uds_k] = master_catalogue['ferr_uds_k'][has_uds_k]
master_catalogue['m_ukidss_k'][has_uds_k] = master_catalogue['m_uds_k'][has_uds_k]
master_catalogue['merr_ukidss_k'][has_uds_k] = master_catalogue['merr_uds_k'][has_uds_k]
master_catalogue['flag_ukidss_k'][has_uds_k] = master_catalogue['flag_uds_k'][has_uds_k]

master_catalogue['f_ukidss_j'][has_uds_j] = master_catalogue['f_uds_j'][has_uds_j]
master_catalogue['ferr_ukidss_j'][has_uds_j] = master_catalogue['ferr_uds_j'][has_uds_j]
master_catalogue['m_ukidss_j'][has_uds_j] = master_catalogue['m_uds_j'][has_uds_j]
master_catalogue['merr_ukidss_j'][has_uds_j] = master_catalogue['merr_uds_j'][has_uds_j]
master_catalogue['flag_ukidss_j'][has_uds_j] = master_catalogue['flag_uds_j'][has_uds_j]

has_ap_uds_k =  ~np.isnan(master_catalogue['f_ap_uds_k'])
has_ap_uds_j =  ~np.isnan(master_catalogue['f_ap_uds_j'])
has_ap_ukidss_k =  ~np.isnan(master_catalogue['f_ap_ukidss_k'])
has_ap_ukidss_j =  ~np.isnan(master_catalogue['f_ap_ukidss_j'])

master_catalogue['f_ap_ukidss_k'][has_ap_uds_k] = master_catalogue['f_ap_uds_k'][has_ap_uds_k]
master_catalogue['ferr_ap_ukidss_k'][has_ap_uds_k] = master_catalogue['ferr_ap_uds_k'][has_ap_uds_k]
master_catalogue['m_ap_ukidss_k'][has_ap_uds_k] = master_catalogue['m_ap_uds_k'][has_ap_uds_k]
master_catalogue['merr_ap_ukidss_k'][has_ap_uds_k] = master_catalogue['merr_ap_uds_k'][has_ap_uds_k]

master_catalogue['f_ap_ukidss_j'][has_ap_uds_j] = master_catalogue['f_ap_uds_j'][has_ap_uds_j]
master_catalogue['ferr_ap_ukidss_j'][has_ap_uds_j] = master_catalogue['ferr_ap_uds_j'][has_ap_uds_j]
master_catalogue['m_ap_ukidss_j'][has_ap_uds_j] = master_catalogue['m_ap_uds_j'][has_ap_uds_j]
master_catalogue['merr_ap_ukidss_j'][has_ap_uds_j] = master_catalogue['merr_ap_uds_j'][has_ap_uds_j]

master_catalogue.remove_columns(['f_uds_j','ferr_uds_j','m_uds_j','merr_uds_j','flag_uds_j',
                               'f_uds_k','ferr_uds_k','m_uds_k','merr_uds_k','flag_uds_k',
                               'f_ap_uds_j','ferr_ap_uds_j','m_ap_uds_j','merr_ap_uds_j',
                               'f_ap_uds_k','ferr_ap_uds_k','m_ap_uds_k','merr_ap_uds_k'])


ukidss_origin = Table()
ukidss_origin.add_column(master_catalogue['ukidss_intid'])
origin = np.full(len(master_catalogue), '     ', dtype='<U5')
origin[has_uds_k] = "UDS"
origin[has_ukidss_k] = "DXS"
ukidss_origin.add_column(Column(data=origin, name= 'f_ukidss_k' ))
origin = np.full(len(master_catalogue), '     ', dtype='<U5')
origin[has_uds_j] = "UDS"
origin[has_ukidss_j] = "DXS"
ukidss_origin.add_column(Column(data=origin, name= 'f_ukidss_j' ))
origin_ap = np.full(len(master_catalogue), '     ', dtype='<U5')
origin_ap[has_ap_uds_k] = "UDS"
origin_ap[has_ap_ukidss_k] = "DXS"
ukidss_origin.add_column(Column(data=origin_ap, name= 'f_ap_ukidss_k' ))
origin_ap = np.full(len(master_catalogue), '     ', dtype='<U5')
origin_ap[has_ap_uds_j] = "UDS"
origin_ap[has_ap_ukidss_j] = "DXS"
ukidss_origin.add_column(Column(data=origin_ap, name= 'f_ap_ukidss_j' ))

ukidss_origin.write("{}/xmm-lss_ukidss_fluxes_origins{}.fits".format(OUT_DIR, SUFFIX), overwrite=True)

IX - Cross-identification tableÂ¶

We are producing a table associating to each HELP identifier, the identifiers of the sources in the pristine catalogues. This can be used to easily get additional information from them.

For convenience, we also cross-match the master list with the SDSS catalogue and add the objID associated with each source, if any. TODO: should we correct the astrometry with respect to Gaia positions?

XI - Saving the catalogueÂ¶

columns = ["help_id", "field", "ra", "dec", "hp_idx"]

bands = [column[5:] for column in master_catalogue.colnames if 'f_ap' in column]
for band in bands:
    columns += ["f_ap_{}".format(band), "ferr_ap_{}".format(band),
                "m_ap_{}".format(band), "merr_ap_{}".format(band),
                "f_{}".format(band), "ferr_{}".format(band),
                "m_{}".format(band), "merr_{}".format(band),
                "flag_{}".format(band)]    
    
columns += ["stellarity", "stellarity_origin", "flag_cleaned", "flag_merged", "flag_gaia", "flag_optnir_obs", "flag_optnir_det", 
            "zspec", "zspec_qual", "zspec_association_flag", "ebv"]

# We check for columns in the master catalogue that we will not save to disk.
print("Missing columns: {}".format(set(master_catalogue.colnames) - set(columns)))

Missing columns: {'uds_flag_gaia', 'ukidss_ra', 'uds_id', 'dxs_stellarity', 'ukidss_dec', 'dxs_flag_cleaned', 'uds_flag_cleaned', 'ukidss_flag_merged', 'ukidss_intid', 'dxs_flag_gaia', 'uds_stellarity', 'dxs_id'}

master_catalogue.write("{}/ukidss_merged_catalogue_xmm-lss.fits".format(TMP_DIR), overwrite = True)

idx	dxs_id	ukidss_ra	ukidss_dec	m_ap_ukidss_j	merr_ap_ukidss_j	m_ukidss_j	merr_ukidss_j	m_ap_ukidss_k	merr_ap_ukidss_k	m_ukidss_k	merr_ukidss_k	dxs_stellarity	f_ap_ukidss_j	ferr_ap_ukidss_j	f_ukidss_j	ferr_ukidss_j	flag_ukidss_j	f_ap_ukidss_k	ferr_ap_ukidss_k	f_ukidss_k	ferr_ukidss_k	flag_ukidss_k	dxs_flag_cleaned	dxs_flag_gaia	ukidss_flag_merged	uds_id	m_ap_uds_j	merr_ap_uds_j	m_uds_j	merr_uds_j	m_ap_uds_h	merr_ap_uds_h	m_uds_h	merr_uds_h	m_ap_uds_k	merr_ap_uds_k	m_uds_k	merr_uds_k	uds_stellarity	f_ap_uds_j	ferr_ap_uds_j	f_uds_j	ferr_uds_j	flag_uds_j	f_ap_uds_h	ferr_ap_uds_h	f_uds_h	ferr_uds_h	flag_uds_h	f_ap_uds_k	ferr_ap_uds_k	f_uds_k	ferr_uds_k	flag_uds_k	uds_flag_cleaned	uds_flag_gaia
		deg	deg
0	446679662346	36.0145895893	-4.1914370971	10.973531723	0.000240365581703	10.3574018478	0.000156873778906	11.6528406143	0.000258496089373	11.0236082077	0.000170237952261	0.993865013123	148110.953125	32.7895240784	261239.640625	37.7454948425	False	79225.2421875	18.8622398376	141434.890625	22.1762771606	False	False	3	False	-1	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	False	nan	nan	nan	nan	False	nan	nan	nan	nan	False	False	0
1	446679731005	36.026631441	-4.37276054615	11.1569910049	0.000259336782619	11.4399852753	0.000260439992417	11.768781662	0.000270285963779	12.4594335556	0.00034982879879	0.993865013123	125084.476562	29.8774280548	96384.1640625	23.1200656891	False	71201.1796875	17.7250061035	37690.0273438	12.1438865662	False	False	3	False	-1	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	False	nan	nan	nan	nan	False	nan	nan	nan	nan	False	False	0
2	446679662230	35.8481298196	-4.18079238779	11.1576871872	0.000261054199655	10.0388031006	0.000136062808451	11.9033460617	0.000289286632324	10.8097848892	0.000156978188897	0.993865013123	125004.304688	30.0560092926	350331.0	43.9029502869	False	62901.5703125	16.7596740723	172220.921875	24.9000873566	False	False	3	False	-1	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	False	nan	nan	nan	nan	False	nan	nan	nan	nan	False	False	0
3	446679747598	37.122300951	-4.23221367535	11.2415380478	0.000261599343503	10.5560283661	0.000173813969013	11.8641052246	0.000270959571935	13.1546230316	0.000465840741526	0.993865013123	115713.664062	27.8802680969	217564.734375	34.8296318054	False	65216.5429688	16.2756347656	19867.8417969	8.52439975739	False	False	3	False	-1	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	False	nan	nan	nan	nan	False	nan	nan	nan	nan	False	False	0
4	446679696799	35.156308275	-3.5583841537	11.3047704697	0.000263427878963	11.3313045502	0.000244181370363	11.7608480453	0.000274372170679	11.064956665	0.000177362468094	0.993865013123	109167.070312	26.4867744446	106531.5	23.9588661194	False	71723.375	18.1249332428	136149.859375	22.2410144806	False	False	3	False	-1	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	False	nan	nan	nan	nan	False	nan	nan	nan	nan	False	False	0
5	446679723488	35.5558199274	-4.37990290347	11.1882667542	0.000265130685875	10.9516468048	0.000207722579944	11.9421949387	0.000288946466753	11.6122217178	0.000230159494095	0.993865013123	121532.695312	29.6776008606	151126.6875	28.9134922028	False	60690.65625	16.1515769958	82245.3203125	17.4347515106	False	False	3	False	-1	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	False	nan	nan	nan	nan	False	nan	nan	nan	nan	False	False	0
6	446679701310	35.1257897114	-4.18246167238	11.3277873993	0.000267965486273	11.1208705902	0.000223042094149	11.8560142517	0.000284405075945	12.1481370926	0.0003003840975	0.993865013123	106877.15625	26.3778514862	129315.804688	26.5652637482	False	65704.359375	17.2110424042	50204.7695312	13.8898506165	False	False	3	False	-1	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	False	nan	nan	nan	nan	False	nan	nan	nan	nan	False	False	0
7	446679827513	35.7965920392	-4.60561677262	11.3206930161	0.000276284758002	11.2076768875	0.000232174410485	11.9665870667	0.000292441487545	13.0573616028	0.000493142928462	0.993865013123	107577.796875	27.3750705719	119379.320312	25.528137207	False	59342.3867188	15.9837875366	21729.7753906	9.86969470978	False	False	3	False	-1	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	False	nan	nan	nan	nan	False	nan	nan	nan	nan	False	False	0
8	446679772336	36.4279976703	-4.75601392426	11.372423172	0.000279041560134	11.1603746414	0.000229256344028	12.1124687195	0.000302172469674	13.9785499573	0.000753796193749	0.993865013123	102572.414062	26.3618049622	124695.273438	26.3297672272	False	51881.4726562	14.4391918182	9302.07421875	6.45816898346	False	False	3	False	-1	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	False	nan	nan	nan	nan	False	nan	nan	nan	nan	False	False	0
9	446679657525	35.9637205717	-3.61269340031	11.3327627182	0.000279808591586	10.5878992081	0.000174285465619	11.8759050369	0.000287196628051	11.7571849823	0.000245219154749	0.993865013123	106388.515625	27.4177284241	211271.15625	33.9138450623	False	64511.5976562	17.0644702911	71965.7578125	16.2538375854	False	False	3	False	-1	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	nan	False	nan	nan	nan	nan	False	nan	nan	nan	nan	False	False	0