Gene Mmcs_2038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_2038
Symbol
ID	4110871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	2186735
End bp	2188072
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	71%
IMG OID	638031159
Product	deoxyribodipyrimidine photo-lyase type I
Protein accession	YP_639202
Protein GI	108799005
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCACGC TGTTGTGGTT CCGCCGCGAT CTGCGCCTGC ACGATCTGCC CGCGCTGGTC 
GATGCGGCCC AGGGCGACGG TCAGGTGCTC GCCTGCTATG TGCTGGATCC GAGACTGCAC 
AGGTCGGCGG GCCCGCGGCG GCTGCAGTAC CTGCACGACG CCCTGCGGGA TCTGCGCGAC 
CAGCTCGACG GCCGGCTGCT GGTGACCCGC GGCCGCCCGG AGCAGCGGAT CCCGGCGCTG 
GCGAAGAGCA TCGACGCGTC GGCGGTGTAC GTCTCCGGCG ACTTCACCCC GTTCGGACGG 
CGACGCGATG ACGCCGTCCG GAAAGCTCTG GGCGAGGTTC CCCTCCAACC GTCCGGTTCG 
CCCTATCTGG TGTCGCCGGG CCGGGTCACC AAGGGCGACG GGACGCCGTA CAAGGTGTTC 
AGCCCGTTCT TCGACGCCTG GCGCAGACAC GGTTGGCGCG CGCCGGCACA GAGCGGGCCG 
GATTCGGCGA CGTGGATCGA CCCGGCGGAT CTGACGGGCC GCGATCTGCG GACCGAGATC 
CCCGACGACG GCGCCACCCT GGACATCCCC GCGGGTGAGC GCGCCGCGGC GCAGCACTGG 
CGGGCGTTCG TCGCCGACGA ACTCGACGGT TACGCCGACA ACCGCAACCG CCCGGACCTC 
GACGTCACCA GCCGGATGTC GGCGCACCTG AAGTTCGGGA CCATCCATCC CCGCACGATG 
GTCGACGACC TCGGGCGGGG CAAAGGCGCC CAGGCGTATC TGCGGGAACT GGCGTTCCGC 
GACTTCTACG CGGCGGTGCT CCACGAGTGG CCCCGCAGCG TGTGGTGGAA CTGGAACACC 
GGGTTCGACG GCATCCGCGT CGACGAGGGT GCGGTGGCCG AGCAGCGCTT CGACGCGTGG 
AAGCGCGGGC GCACCGGGTT CCCGATCGTC GACGCCGGGA TGCGTCAACT CGCCGGGATC 
GGCTGGATGC ACAACCGGGT CCGGATGATC GTGGCCTCGT TCCTGGTCAA GGACCTGCAC 
CTGCCGTGGC AGTGGGGGGC GCGCTGGTTC CTCGAGCAGC TGGTCGACGG CGATATGGCC 
AACAACCAGC ACGGGTGGCA GTGGACCGCG GGGTGCGGCA CCGACGCCGC ACCGTTCTTC 
CGGGTGTTCA ACCCCTCGAC GCAGGGCGCG AAGTTCGATC CGGACGGCAC GTACGTGCGG 
CGGTGGGTGC CCGAACTGAA GGGGGTGGCC GACGTGCACA AGATGGGTGA CGATCGCCCG 
GCGGACTACC CCGCACCCAT CGTCGACCAT GCGGCCGAAC GGGCCGAGGC GCTGCGCCGC 
TACGCCGAGA TCTCCTAG

Protein sequence

MPTLLWFRRD LRLHDLPALV DAAQGDGQVL ACYVLDPRLH RSAGPRRLQY LHDALRDLRD 
QLDGRLLVTR GRPEQRIPAL AKSIDASAVY VSGDFTPFGR RRDDAVRKAL GEVPLQPSGS 
PYLVSPGRVT KGDGTPYKVF SPFFDAWRRH GWRAPAQSGP DSATWIDPAD LTGRDLRTEI 
PDDGATLDIP AGERAAAQHW RAFVADELDG YADNRNRPDL DVTSRMSAHL KFGTIHPRTM 
VDDLGRGKGA QAYLRELAFR DFYAAVLHEW PRSVWWNWNT GFDGIRVDEG AVAEQRFDAW 
KRGRTGFPIV DAGMRQLAGI GWMHNRVRMI VASFLVKDLH LPWQWGARWF LEQLVDGDMA 
NNQHGWQWTA GCGTDAAPFF RVFNPSTQGA KFDPDGTYVR RWVPELKGVA DVHKMGDDRP 
ADYPAPIVDH AAERAEALRR YAEIS