Gene B21_03405 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03405
Symbol	mtlA
ID	8112602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3633485
End bp	3635398
Gene Length	1914 bp
Protein Length	637 aa
Translation table	11
GC content	54%
IMG OID	644849578
Product	hypothetical protein
Protein accession	YP_003001151
Protein GI	251786847
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2213] Phosphotransferase system, mannitol-specific IIBC component
TIGRFAM ID	[TIGR00851] PTS system, mannitol-specific IIC component

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATCCG ATATTAAGAT CAAAGTGCAA AGCTTTGGTC GTTTCCTCAG CAACATGGTG 
ATGCCAAATA TCGGCGCGTT TATCGCGTGG GGTATCATCA CCGCGTTATT TATTCCAACA 
GGGTGGTTAC CGAACGAGAC GCTGGCGAAG CTGGTCGGGC CGATGATCAC TTATCTCCTG 
CCGCTGCTGA TCGGTTATAC CGGTGGTAAG CTGGTAGGCG GCGAACGTGG CGGCGTAGTC 
GGTGCCATCA CCACCATGGG CGTTATCGTC GGCGCAGACA TGCCGATGTT CCTCGGTTCT 
ATGATTGCAG GTCCGCTGGG CGGCTGGTGC ATTAAGCACT TCGACCGCTG GGTAGACGGT 
AAGATCAAAT CCGGTTTTGA GATGCTGGTG AATAACTTCT CCGCAGGCAT CATCGGGATG 
ATCCTCGCTA TTCTGGCATT CCTCGGCATT GGCCCGATTG TTGAAGCCCT GTCCAAAATG 
CTGGCTGCGG GCGTTAACTT CATGGTTGTC CATGACATGC TGCCGCTGGC GTCTATCTTT 
GTTGAACCGG CGAAAATCCT GTTCCTCAAC AACGCCATTA ACCACGGTAT CTTCTCGCCG 
CTGGGTATTC AGCAGTCCCA TGAACTGGGT AAATCAATCT TCTTCCTGAT TGAAGCTAAC 
CCAGGTCCAG GTATGGGCGT GCTGCTGGCG TACATGTTCT TTGGTCGTGG TAGCGCTAAA 
CAGTCTGCGG GCGGTGCGGC AATCATCCAC TTCCTGGGTG GTATCCACGA AATCTACTTC 
CCGTATGTGC TGATGAATCC GCGTCTGATC CTCGCAGTCA TCCTCGGCGG TATGACTGGC 
GTGTTCACGC TGACTATCCT GGGCGGTGGT CTGGTTTCTC CGGCATCTCC GGGTTCTATC 
CTTGCTGTAC TGGCGATGAC ACCAAAAGGT GCTTACTTCG CTAACATCGC GGGTGTGTGT 
GCGGCGATGG CTGTCTCCTT CGTTGTCTCT GCTATTTTGC TGAAAACCAG CAAAGTGAAA 
GAAGAAGATG ATATTGAAGC AGCAACTCGT CGTATGCAGG ACATGAAAGC TGAGTCTAAA 
GGCGCATCTC CGCTGTCTGC TGGCGATGTG ACTAACGACC TGAGCCACGT ACGTAAAATC 
ATCGTTGCCT GTGACGCCGG TATGGGTTCC AGTGCGATGG GCGCAGGCGT TCTGCGTAAG 
AAAATTCAGG ATGCAGGTCT GTCGCAGATT TCTGTTACTA ACAGCGCGAT CAACAACCTG 
CCGCCAGATG TGGACCTCGT CATCACTCAC CGTGACCTGA CCGAACGCGC TATGCGCCAG 
GTTCCGCAGG CACAGCATAT TTCGCTGACC AACTTCCTCG ACAGCGGCCT GTACACCAGC 
CTGACCGAAC GTCTGGTTGC TGCCCAACGC CACACGGCAA ACGAAGAGAA AGTAAAAGAC 
AGCCTGAAAG ACAGCTTTGA CGATTCCAGT GCTAACCTGT TCAAGCTAGG CGCGGAGAAC 
ATCTTCCTCG GTCGCAAAGC GGCAACCAAA GAAGAAGCGA TTCGTTTTGC TGGCGAGCAG 
CTGGTGAAAG GCGGTTACGT TGAGCCGGAA TACGTTCAGG CGATGCTGGA TCGTGAAAAA 
CTGACCCCGA CTTATCTGGG TGAGTCTATC GCGGTGCCAC ACGGTACGGT TGAAGCGAAA 
GATCGCGTAC TGAAAACGGG CGTCGTGTTC TGCCAGTACC CGGAAGGCGT GCGCTTCGGT 
GAAGAAGAAG ATGACATTGC CCGTCTGGTG ATTGGTATTG CTGCCCGTAA CAACGAGCAC 
ATTCAGGTTA TCACCAGCCT GACCAATGCA CTGGATGATG AGTCCGTCAT CGAGCGTCTG 
GCACACACCA CCAGCGTGGA TGAAGTGCTG GAACTGCTGG CAGGTCGTAA GTAA

Protein sequence

MSSDIKIKVQ SFGRFLSNMV MPNIGAFIAW GIITALFIPT GWLPNETLAK LVGPMITYLL 
PLLIGYTGGK LVGGERGGVV GAITTMGVIV GADMPMFLGS MIAGPLGGWC IKHFDRWVDG 
KIKSGFEMLV NNFSAGIIGM ILAILAFLGI GPIVEALSKM LAAGVNFMVV HDMLPLASIF 
VEPAKILFLN NAINHGIFSP LGIQQSHELG KSIFFLIEAN PGPGMGVLLA YMFFGRGSAK 
QSAGGAAIIH FLGGIHEIYF PYVLMNPRLI LAVILGGMTG VFTLTILGGG LVSPASPGSI 
LAVLAMTPKG AYFANIAGVC AAMAVSFVVS AILLKTSKVK EEDDIEAATR RMQDMKAESK 
GASPLSAGDV TNDLSHVRKI IVACDAGMGS SAMGAGVLRK KIQDAGLSQI SVTNSAINNL 
PPDVDLVITH RDLTERAMRQ VPQAQHISLT NFLDSGLYTS LTERLVAAQR HTANEEKVKD 
SLKDSFDDSS ANLFKLGAEN IFLGRKAATK EEAIRFAGEQ LVKGGYVEPE YVQAMLDREK 
LTPTYLGESI AVPHGTVEAK DRVLKTGVVF CQYPEGVRFG EEEDDIARLV IGIAARNNEH 
IQVITSLTNA LDDESVIERL AHTTSVDEVL ELLAGRK