Gene Mmcs_2420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_2420
Symbol
ID	4111253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	2570262
End bp	2571593
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	69%
IMG OID	638031545
Product	extracellular solute-binding protein
Protein accession	YP_639584
Protein GI	108799387
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.783182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATCC CGAAGCTCGG CCGGCGCCCA GCGCGGCGGA AAGCCACGCG CTGGATGCCG 
GCACTGGCCA TGACCGCAGG ACTCGCTTTG GCCGGCTGCG CCGGATCCGG TGGCTCCGGC 
GACGAGCAGA GCTCGTCGGG GTTGGGGGAC ATCCCGACCG ACACCAACGC AACCGTGCGG 
GTGCTCATGG AGAACGTGCC CGACACCGAC ATCGTGCAGG GCATGGTCGG ACAGTTCAAC 
GAGAAGTACC CCGACATCAA GGTCCAGATC GAGACCATGA CGTTCGACCA GATGCGTGAC 
CGCCTGGTGT CGTCGTTCCA GTCGGCCGAA CCCGCCTACG ACCTGATCGT CGTCGACAAC 
CCGTGGATGG ACGATTTCGC CGCCGCGGGC TTCCTCGAGC CGCTGAACGA CCGGATCTCC 
TCGACCCCCG ACTACCAGCC GGACGACTTC TTCCCGTCGC TGACCGACAT CACCGACGTC 
GACGGCACGA CCTACGGGGT GCCGTTCTAC AACTACGCAC TGGGCTACAT CTACAACAAG 
CCGGATCTGC AGGCCGCGAA CCTGCAGGTG CCGACCGACC TCGACGCGCT GGTGTCGACG 
TCGCAGCGGC TCAAGGCGGG CGACCGCGCC GGTATCGCCA TGCAGCCGCA GCGCGGGTAC 
AAGATCTTCG AGGAATGGGC GAACTGGCTG TTCGCCGCGG GCGGGTCGAT CTACGACGCG 
GACGGTAAGC CGACGCTGAA CACCGAGCAG GCCGCCCGCG CCCTGGACGC CTACATCGAG 
ACCTACCGCA CCGCGGCCCC GGCCAACAGC CTGAACTGGG GCTTCGACGA GGCCTTCCGC 
TCGGTCTCCG GCGGCAACGC CGCCTCGATG ATCGGCTACA ACTGGAACCT GCCCGCGCTC 
AACGACCCCG CCGGGGCGTC GGGTGCGCGC GCCGGACAGT TCGCGTTGGC GCCGATTCCC 
GGCGGCAAGT CCGCGCTGGG CCTGTGGAGC TGGGCGATCC CGGCGAACTC GGCGGCTCCG 
GACGCGGCCT GGGCGTTCAC GTCCTGGATC ACCTCACCCG CCGTCGACGC CCAGCGCGTC 
GCCGAGGGCG GTGCGGTGAC CCGCAAGGGT TCGCTGACCG ATCCAAAGGT GCTGGCCGAC 
GGGTACGGCG AGGAGTACTA CCGCGTCGTC GGTGAGATCC TGGCCGACGC GGCCCCGCTC 
TCCCAGGGCC GCGGTGGTGA GGAGATGATC CAGGCCGTGG GAACCGAGCT CAACGACGCG 
GCGGCGGGCA ACAAGAGCGT GGCCGACGCA CTGCGCGACG CCCAGGCGGC CGCAGAGCGA 
ATCCAGCAGT GA

Protein sequence

MKIPKLGRRP ARRKATRWMP ALAMTAGLAL AGCAGSGGSG DEQSSSGLGD IPTDTNATVR 
VLMENVPDTD IVQGMVGQFN EKYPDIKVQI ETMTFDQMRD RLVSSFQSAE PAYDLIVVDN 
PWMDDFAAAG FLEPLNDRIS STPDYQPDDF FPSLTDITDV DGTTYGVPFY NYALGYIYNK 
PDLQAANLQV PTDLDALVST SQRLKAGDRA GIAMQPQRGY KIFEEWANWL FAAGGSIYDA 
DGKPTLNTEQ AARALDAYIE TYRTAAPANS LNWGFDEAFR SVSGGNAASM IGYNWNLPAL 
NDPAGASGAR AGQFALAPIP GGKSALGLWS WAIPANSAAP DAAWAFTSWI TSPAVDAQRV 
AEGGAVTRKG SLTDPKVLAD GYGEEYYRVV GEILADAAPL SQGRGGEEMI QAVGTELNDA 
AAGNKSVADA LRDAQAAAER IQQ