Gene Hmuk_2541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2541
Symbol
ID	8412085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	2446241
End bp	2447641
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	69%
IMG OID	645020882
Product	Deoxyribodipyrimidine photo-lyase
Protein accession	YP_003178356
Protein GI	257388583
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.272644
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAATCC ACTGGCATCG ACGCGACCTC CGGACGACCG ACAACGCCGG CCTGGCCGCA 
GCGACGGCCG ACAGCCCGGT CGTGCCGGTG TTCGTCTTCG ACGACGCCGT CCTCGACCAC 
GCCGCACCGC CCCGCGTGGC GTTCATGCTG GACGCGCTCG ACTCGCTGCG GGCACAGTAC 
CGCGACCGCG GGAGCGACCT CGTGATCGCT CACGGCGATC CGACGGCCGA GATCCCGCGG 
CTGGCCGAGG CGTTCGGAGC CGACGGCGTG ACCTGGGGCG AGGCCTACTC CGGGCTCGGA 
ATCGAGCGCG ACATCGCCGT CCGGCAGGCC CTCGACGACG TGGGCGTCGA ACGCGAGGCG 
GTCACCGATT CGGTTCACCA TCGCCCCGGC GAGATCACGA CCAACGACGG CGATCCGTAC 
TCGGTGTTCA CGTACTTCGG GCGCAAGTGG CACGACCGGG AGAAAGAGGA CCCCTACGAC 
GCGCCCGGCC CGGACGAACT GGCCGACGTG TCCGGCGATC CCCTGCCGTC GGTGGGAGAC 
CTGGGGTTCG AGGAACCACA GGCAGAGATC CCTCCGGCGG GGACGGAGCC GGCCCGGGAG 
CTCCTCGACG CGTTCTGCGA GGACGACATC TATCGGTACG AGGACCGCCG AGACTACCCC 
GCAGACGACT GCACCTCACG GCTCTCGGCT CACCTCAAGT TCGGGACGAT CGGCATCAGG 
GAGGTGTACG AGCGGACCGC GAGCGCGGCG GCAGCGGCCG ACGACGAGGA ACGGCGCGAA 
TCCGTCGCGG AGTTCCAGTC GCAGTTGGCC TGGCGGGAGT TCTACACGCA GGTCCTCTTT 
GCCAACCGGT CGGTCGTCAC GGACAACTAC AAGACCTACG AGCGCCCGCT CCAGTGGCGC 
GACGACCCCG AGGCGCTCCA GGCCTGGAAG GACGGCGAGA CGGGATACCC GATCGTCGAC 
GCCGGGATGC GCCAGCTCCG CCAGGAGGCG TTCGTGCACA ACCGCGTCCG GATGATCGTC 
GCCTCCTTTC TCACCAAGGA CTTGCTGATC GACTGGCGAG CGGGATACGA GTGGTTCAAA 
GAGCGTCTGG TGGACCACGA CACCGCGAAC GACAACGGCG GGTGGCAGTG GGCCGCCTCG 
ACGGGAACCG ACGCCCAGCC GTACTTCCGG ATCTTCAATC CGATGACTCA GGGCGAGCGG 
TACGACCCCG ACGCGGAGTA CATCAAGACG TACGTCCCCG AACTGCGTGA CGCCGAGCCG 
TCGGTGATCC ACGAGTGGCC CGACCTCTCG CTGACCCAGC GTCGCAACGC CGCCCCGGAG 
TACCCCGACC CCATCGTCGA CCACAGCGAG CGGCGCGACC AGGCTCTGGA GATGTTCGAG 
ACCGCCCGCG GCGAGAGCTG A

Protein sequence

MRIHWHRRDL RTTDNAGLAA ATADSPVVPV FVFDDAVLDH AAPPRVAFML DALDSLRAQY 
RDRGSDLVIA HGDPTAEIPR LAEAFGADGV TWGEAYSGLG IERDIAVRQA LDDVGVEREA 
VTDSVHHRPG EITTNDGDPY SVFTYFGRKW HDREKEDPYD APGPDELADV SGDPLPSVGD 
LGFEEPQAEI PPAGTEPARE LLDAFCEDDI YRYEDRRDYP ADDCTSRLSA HLKFGTIGIR 
EVYERTASAA AAADDEERRE SVAEFQSQLA WREFYTQVLF ANRSVVTDNY KTYERPLQWR 
DDPEALQAWK DGETGYPIVD AGMRQLRQEA FVHNRVRMIV ASFLTKDLLI DWRAGYEWFK 
ERLVDHDTAN DNGGWQWAAS TGTDAQPYFR IFNPMTQGER YDPDAEYIKT YVPELRDAEP 
SVIHEWPDLS LTQRRNAAPE YPDPIVDHSE RRDQALEMFE TARGES