Gene Hlac_0288 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0288
Symbol
ID	7401214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	310553
End bp	311950
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	67%
IMG OID	643707351
Product	DNA photolyase FAD-binding
Protein accession	YP_002564963
Protein GI	222478726
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.155544
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.119697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCTAT TTTGGCACCG ACGCGATCCG CGCACCCGGG ACAACGTCGG ACTCGCGGCG 
GCCGCACGGA CGGGGACCGT CGTCCCCGTC TTCGTCTACG ACACCGACCT GTTCGGGACG 
ATGGGTGCAC GCCAGCGGGC CTTCTTCCTC CGACACGTAA AGCGACTGAA GGAGCGCTAC 
CGAGAGTTCG GAAGCGACCT CGTCGTCCGC GCGGGCGACC CGGAGAAGGT CCTCGTCGAT 
CTCGCCGACG AGTACGACGC GGAGGCGGTC TTCTACAACG AGTACTACCG TCCCGCGAGG 
CGGAACCGCC AGCGGGCCGT CGAGGGGGCG CTCGAGGGCT TCGGTGTCGA AACGAATGCA 
CGGACCGATG CCGTGTTAGT CGATCCCGGC CGGCTGGAGG AGCGCTACGC GAATCACGGT 
CGATTTCACG ATGAGTGGGA GACCGTCCCT AAGCCCGAGC CGTCCCCGGA ACCAGACGCG 
GACGCGCTCG TGAACATGCG CGACGAAAAA ACGGTCTCTG AGATTGACCC CGACATCGAC 
CCCGACATCG ACCTGCCGGC GACCGGCTAC CGGGCCGCAC GCGAGCGGTT CGACGGCTTC 
CTCGAACACG GAATCCGGTC GTACGCCGAC ACGCGCGACG ACCTTGCCCG GGCCGTCGAG 
GCGCCGACGC ACGCGGTCTC GCGAATGTCG CCGTACCTCG CAACGGGGGC GATCGGGATC 
CGGGAGATGT GGGCGGACGC GACCGACGCG TTCGAGGCGG CGACGGGCGA CGAGCGCCGC 
AACGTCGACA AGTACCGCGA CGAGCTGTCG TGGCGCGAGC AGATGTACCA CCTGCTGTAC 
TACACCCCCG ATCTGGCCGT CGCGAACTAC AAATCGTTCC CGAACGAGAT CGCGTGGCGC 
GAGGACGACA CGGCGTTCGA GGCGTGGACG CGCGGCGAGA CCGGCTACCC GCTCGTCGAC 
GCCGGGATGC GCCAGCTGAA CGCGGAGGGG TACGTCCACA ACCGCCCGCG ACAGGTGGTC 
GCGAGCTTTC TCACGAAACA CCTCCTGATC GACTGGCGGC GCGGGGCGCG CTACTTCACC 
ACACAGCTGA TCGACCACGA CCACGCCTCG AACCACGGCG CGTGGCAGTG GACCGCCTCC 
ACCGGCACCG ATTCGGTGGA TGTGCGCATC TTCGATCCGG TGGCACAGAT GGCGAAGTAC 
GACGCTGACG CGACGTTTGT GAAAGAATAC GTCCCCGAAC TGCGAGACGT GCCCGCCGAG 
GAGATAGTCG ACTGGCCGAC TCTCTCGCGG GTCGAGCGCG AGACGCTGGC GCCGGAGTAC 
CCGCATCCGA TCGTCGACCG GAACGAGGGG TACGAGCGGG CGCAGCGGGT GTTCGAGGAA 
GCGCTCGGGA AGCGGTGA

Protein sequence

MQLFWHRRDP RTRDNVGLAA AARTGTVVPV FVYDTDLFGT MGARQRAFFL RHVKRLKERY 
REFGSDLVVR AGDPEKVLVD LADEYDAEAV FYNEYYRPAR RNRQRAVEGA LEGFGVETNA 
RTDAVLVDPG RLEERYANHG RFHDEWETVP KPEPSPEPDA DALVNMRDEK TVSEIDPDID 
PDIDLPATGY RAARERFDGF LEHGIRSYAD TRDDLARAVE APTHAVSRMS PYLATGAIGI 
REMWADATDA FEAATGDERR NVDKYRDELS WREQMYHLLY YTPDLAVANY KSFPNEIAWR 
EDDTAFEAWT RGETGYPLVD AGMRQLNAEG YVHNRPRQVV ASFLTKHLLI DWRRGARYFT 
TQLIDHDHAS NHGAWQWTAS TGTDSVDVRI FDPVAQMAKY DADATFVKEY VPELRDVPAE 
EIVDWPTLSR VERETLAPEY PHPIVDRNEG YERAQRVFEE ALGKR