Gene Mmcs_5159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5159
Symbol
ID	4113988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	5449085
End bp	5450095
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	72%
IMG OID	638034317
Product	twin-arginine translocation pathway signal
Protein accession	YP_642319
Protein GI	108802122
COG category	[R] General function prediction only
COG ID	[COG5012] Predicted cobalamin binding protein
TIGRFAM ID	[TIGR00640] methylmalonyl-CoA mutase C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGGCCC GATACGAGGC CACGCTCGTC GCCGACGACG CGACGTCCGC CCGCGCGCTG 
GTCGAGGAAC TGCTGGCCGA CGGGATCGAT CCGGTGACCG TGCTGACCGA TGTGGTGGCC 
CGCACCCAAC GTGAGGTCGG TACCCGCTGG CAACGCGGTG AGTGGACCGT CGCCCAGGAG 
CACGCCGCGA CGGCGATCTC GGTCGCGGCG ACCAAGGCGG TGTCCCGGCA CGTGCGGCGC 
ACACCGGTCA CAAGGGGACG GATCCTGGTG GCGTGTTCGG AACGGGAGTG GCATGCCCTC 
CCGGCGATGA TCATCGACTG CGCACTGCGT GCGGACGGCT GGGACAGCAC CCTGCTCGGT 
GCGGCCACCT CCCCGATGCG GCTCAACCAG CACCTGCAGG ATCTCGGCCC GGAGGCGGTG 
GCGGTGAGTT GTTCGGTGCT CGGCGCGTTG CCGACCACCC GGCGGTTCAT CGAGGCGAGC 
ACCGCGGCCG GGGTGCCGAT CGTGGTGGGC GGTCCCGCGT TCGGCGCCGA CGACGTGCGG 
GCCCGCGCCC TCGGTGCGAC GGCATGGGCG CCTTCGGCCC AAGCGGCGGT ACTCGCGGTG 
AACGGTCTGC CCGCGGTCGT ACCGCCCGCT CCCCCGCTGC CCGCCGGGCC CGCCGGCGAG 
CAGGCACTGC TCGAGGTCGA CCACCGGATG CTGGTGGACA CACTGCGGGT GCGGTGGTCG 
GTCAGCGCCG CAGCGGGGCC GCCGGAGGCG GCCTCCCCGG GTGACCTCAC CGACGTCGCC 
AACGACGTCC TGCACCAGGT CCTGCACGCG GTCGCCGCGA CCCTGCTGAC CGGGGACCCT 
CGGCCGGTGT CCGAATCAGC TTGGTGGATC GCCGATCTCA TGCGCACCCG CGGTATCGAT 
GTCGCCACCG TGTACGAACT CGGTGACGTC CTGACCGAGT CGTTGTCGGA CTATCCGCTG 
GCGCGCGGGC TGATCGACCG CCACTTCACC GCCGGAATCG ACTGGACCTA G

Protein sequence

MLARYEATLV ADDATSARAL VEELLADGID PVTVLTDVVA RTQREVGTRW QRGEWTVAQE 
HAATAISVAA TKAVSRHVRR TPVTRGRILV ACSEREWHAL PAMIIDCALR ADGWDSTLLG 
AATSPMRLNQ HLQDLGPEAV AVSCSVLGAL PTTRRFIEAS TAAGVPIVVG GPAFGADDVR 
ARALGATAWA PSAQAAVLAV NGLPAVVPPA PPLPAGPAGE QALLEVDHRM LVDTLRVRWS 
VSAAAGPPEA ASPGDLTDVA NDVLHQVLHA VAATLLTGDP RPVSESAWWI ADLMRTRGID 
VATVYELGDV LTESLSDYPL ARGLIDRHFT AGIDWT