Gene SbBS512_E4016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4016
Symbol	mtlA
ID	6271503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	3748745
End bp	3750658
Gene Length	1914 bp
Protein Length	637 aa
Translation table	11
GC content	54%
IMG OID	641727859
Product	PTS system, mannitol-specific IIABC component
Protein accession	YP_001882291
Protein GI	187730307
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2213] Phosphotransferase system, mannitol-specific IIBC component [COG4668] Mannitol/fructose-specific phosphotransferase system, IIA domain
TIGRFAM ID	[TIGR00851] PTS system, mannitol-specific IIC component

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.659103
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATCCG ATATTAAGAT CAAAGTGCAA AGCTTTGGTC GTTTCCTCAG CAACATGGTG 
ATGCCAAATA TCGGCGCGTT TATCGCGTGG GGTATCATCA CCGCGTTATT TATTCCAACA 
GGGTGGTTAC CGAACGAGAC GCTGGCGAAG CTGGTCGGGC CGATGATCAC TTATCTCCTG 
CCGCTGCTGA TCGGTTATAC CGGTGGTAAG CTGGTAGGCG GCGAACGTGG CGGCGTAGTC 
GGTGCCATCA CCACCATGGG CGTTATCGTC GGCGCAGACA TGCCGATGTT CCTCGGTTCT 
ATGATTGCAG GTCCGCTGGG CGGCTGGTGC ATTAAGCACT TCGACCGCTG GGTAGACGGT 
AAGATCAAAT CCGGTTTTGA GATGCTGGTG AATAACTTCT CCGCAGGCAT CATCGGGATG 
ATCCTCGCTA TTCTGGCATT CCTCGGCATT GGCCCGATTG TTGAAGCCCT GTCCAAAATG 
CTGGCTGCGG GCGTTAACTT CATGGTTGTC CATGACATGC TGCCGCTGGC GTCTATCTTT 
GTTGAACCGG CGAAAATCCT GTTCCTCAAC AACGCCATTA ACCACGGTAT CTTCTCGCCG 
CTGGGTATTC AGCAGTCCCA TGAACTGGGT AAATCAATCT TCTTCCTGAT TGAAGCTAAC 
CCAGGTCCAG GTATGGGCGT GCTGCTGGCG TACATGTTCT TTGGTCGTGG TAGCGCTAAA 
CAGTCTGCGG GCGGTGCGGC AATCATCCAC TTCCTGGGTG GTATCCACGA AATCTACTTC 
CCGTATGTGC TGATGAATCC GCGTCTGATC CTCGCAGTCA TCCTCGGCGG TATGACTGGC 
GTGTTCACGC TGACTATCCT GGGCGGTGGT CTGGTTTCTC CGGCATCTCC GGGTTCTATC 
CTTGCTGTAC TGGCGATGAC ACCAAAAGGT GCTTATTTCG CTAACATCGC GGGTGTGTGT 
GCGGCGATGG CTGTCTCCTT CGTTGTCTCT GCTATTTTGC TGAAAACCAG CAAAGTGAAA 
GAAGAAGATG ATATTGAAGC AGCAACTCGT CGTATGCAGG ACATGAAAGC TGAGTCTAAA 
GGCACATCTC CGCTGTCTGC GGGCGATGTG ACTAACGACC TGAGCCACGT ACGTAAAATC 
ATCGTTGCCT GTGACGCCGG TATGGGTTCA AGTGCGATGG GCGCAGGCGT GCTGCGTAAG 
AAAATTCAGG ATGCAGGTCT GTCGCAGATT TCGGTCACTA ACAGCGCGAT CAACAACCTG 
CCGCCAGATG TGGACCTCGT CATCACTCAC CGTGACCTGA CCGAACGCGC TATGCGCCAG 
GTTCCGCAGG CACAGCATAT TTCGCTGACC AACTTCCTCG ACAGCGGCCT GTACACCAGC 
CTAACCGAAC GTCTGGTTGC TGCCCAGCGC CATACTGAAA ACGAAGTGAA AGTGAAAGAC 
AGTCTGAAAG ACAGCTTTGA CGATTCCAGT GCTAACCTGT TCAAACTGGG CGCGGAGAAC 
ATCTTCCTCG GTCGCAAAGC AGCAACCAAA GAAGAAGCGA TTCGTTTTGC TGGCGAGCAG 
CTGGTGAAAG GCGGTTACGT TGAGCCGGAA TACGTTCAGG CGATGCTGGA TCGTGAAAAA 
CTGACCCCGA CTTATCTGGG TGAGTCTATC GCGGTGCCAC ACGGTACGGT TGAAGCGAAA 
GATCGCGTAC TGAAAACGGG CGTGGTGTTC TGCCAGTACC CGGAAGGCGT GCGCTTCGGT 
GAAGAGGAAG ATGACATTGC CCGTCTGGTG ATTGGTATTG CAGCCCGTAA CAACGAGCAC 
ATTCAGGTTA TCACCAGCCT GACCAATGCA CTGGATGATG AGTCCGTCAT CGAGCGTCTG 
GCACACACCA CCAGCGTGGA TGAAGTGCTG GAACTGTTGG CAGGTCGTAA GTAA

Protein sequence

MSSDIKIKVQ SFGRFLSNMV MPNIGAFIAW GIITALFIPT GWLPNETLAK LVGPMITYLL 
PLLIGYTGGK LVGGERGGVV GAITTMGVIV GADMPMFLGS MIAGPLGGWC IKHFDRWVDG 
KIKSGFEMLV NNFSAGIIGM ILAILAFLGI GPIVEALSKM LAAGVNFMVV HDMLPLASIF 
VEPAKILFLN NAINHGIFSP LGIQQSHELG KSIFFLIEAN PGPGMGVLLA YMFFGRGSAK 
QSAGGAAIIH FLGGIHEIYF PYVLMNPRLI LAVILGGMTG VFTLTILGGG LVSPASPGSI 
LAVLAMTPKG AYFANIAGVC AAMAVSFVVS AILLKTSKVK EEDDIEAATR RMQDMKAESK 
GTSPLSAGDV TNDLSHVRKI IVACDAGMGS SAMGAGVLRK KIQDAGLSQI SVTNSAINNL 
PPDVDLVITH RDLTERAMRQ VPQAQHISLT NFLDSGLYTS LTERLVAAQR HTENEVKVKD 
SLKDSFDDSS ANLFKLGAEN IFLGRKAATK EEAIRFAGEQ LVKGGYVEPE YVQAMLDREK 
LTPTYLGESI AVPHGTVEAK DRVLKTGVVF CQYPEGVRFG EEEDDIARLV IGIAARNNEH 
IQVITSLTNA LDDESVIERL AHTTSVDEVL ELLAGRK