Gene B21_03406 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03406
Symbol	mtlD
ID	8112659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3635628
End bp	3636776
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	52%
IMG OID	644849579
Product	hypothetical protein
Protein accession	YP_003001152
Protein GI	251786848
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0246] Mannitol-1-phosphate/altronate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCAT TACATTTTGG CGCAGGTAAT ATCGGTCGTG GCTTTATCGG TAAACTGCTG 
GCAGACGCGG GTATCCAACT GACGTTTGCC GATGTCAATC AGGTGGTACT TGATGCCCTG 
AATGCCCGTC ATAGCTATCA GGTACATGTG GTTGGTGAAA CCGAGCAGGT AGATACCGTT 
TCCGGCGTCA ATGCTGTCAG CAGCATTGGT GATGATGTCG TTGATCTGAT TGCTCAGGTT 
GATTTAGTCA CTACCGCCGT TGGCCCGGTT GTGCTGGAAC GTATTGCTCC GGCAATCGCC 
AAAGGGCTGG TGAAACGTAA AGAACAAGGT AATGAATCCC CGCTGAACAT CATCGCCTGT 
GAAAACATGG TACGCGGTAC CACGCAGCTG AAAGGCCATG TGATGAACGC CCTGCCGGAA 
GACGCCAAAG CGTGGGTAGA AGAACACGTT GGCTTTGTCG ATTCCGCCGT TGACCGCATC 
GTACCGCCTT CGGCTTCGGC AACTAACGAT CCGCTGGAAG TGACGGTAGA AACTTTCAGC 
GAATGGATTG TCGATAAAAC GCAGTTCAAA GGCGCACTGC CGAACATCCC AGGCATGGAG 
TTAACCGACA ACCTGATGGC ATTTGTCGAA CGTAAACTCT TCACCCTGAA CACGGGTCAT 
GCTATAACCG CGTACCTCGG AAAACTGGCC GGTCATCAGA CCATTCGTGA CGCGATTCTC 
GACGAGAAAA TCCGCGCGGT GGTAAAAGGT GCGATGGAAG AAAGTGGTGC AGTATTGATC 
AAGCGCTACG GCTTTGACGC TGACAAGCAT GCGGCGTACA TCCAGAAAAT CCTCGGTCGT 
TTTGAGAACC CGTATCTGAA AGATGATGTA GAGCGCGTAG GCCGTCAGCC GCTGCGTAAA 
CTGAGTGCTG GCGACCGTCT GATCAAGCCA CTGCTCGGTA CGCTGGAATA TGGTCTGCCA 
CATAAAAACC TGATTGAAGG TATTGCCGCT GCAATGCACT TCCGCAGTGA AGATGATCCG 
CAGGCTCAGG AACTGGCAGC ACTGATCGCT GACAAAGGTC CGCAGGCGGC GCTGGCACAG 
ATTTCCGGTC TTGATGCCAA CAGCGAGGTT GTATCCGAGG CGGTAACCGC TTATAAAGCA 
ATGCAATAA

Protein sequence

MKALHFGAGN IGRGFIGKLL ADAGIQLTFA DVNQVVLDAL NARHSYQVHV VGETEQVDTV 
SGVNAVSSIG DDVVDLIAQV DLVTTAVGPV VLERIAPAIA KGLVKRKEQG NESPLNIIAC 
ENMVRGTTQL KGHVMNALPE DAKAWVEEHV GFVDSAVDRI VPPSASATND PLEVTVETFS 
EWIVDKTQFK GALPNIPGME LTDNLMAFVE RKLFTLNTGH AITAYLGKLA GHQTIRDAIL 
DEKIRAVVKG AMEESGAVLI KRYGFDADKH AAYIQKILGR FENPYLKDDV ERVGRQPLRK 
LSAGDRLIKP LLGTLEYGLP HKNLIEGIAA AMHFRSEDDP QAQELAALIA DKGPQAALAQ 
ISGLDANSEV VSEAVTAYKA MQ