Gene EcE24377A_0433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0433
Symbol	malZ
ID	5588632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	455390
End bp	457207
Gene Length	1818 bp
Protein Length	605 aa
Translation table	11
GC content	55%
IMG OID	640924157
Product	maltodextrin glucosidase
Protein accession	YP_001461584
Protein GI	157156114
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGTTAA ATGCATGGCA CCTGCCGGTG CCCCCATTTG TTAAACAAAG CAAAGATCAA 
CTGCTCATTA CACTGTGGCT GACGGGCGAA GACCCACCGC AGCGCATTAT GCTGCGTACA 
GAACACGATA ACGAAGAAAT GTCAGTATCG ATGCATAAGC AGCGCAGTCA GCAGCAGCCT 
GGCGTCACCG CATGGCGTGC GGCGATTGAT CTCTCCAGCG GACAACCCCG GCGGCGTTAC 
AGTTTCAAAC TGCTGTGGCA CGATCGCCAG CGTTGGTTTA CACCGCAGGG CTTCAGCCGA 
ATGCCGCCGG CACGACTGGA GCAGTTTGCC GTCGATGTAC CGGATATCGG CCCACAATGG 
GCTGCGGATC AGATTTTTTA TCAGATCTTC CCTGATCGTT TTGCGCGTAG TCTTCCTCGT 
GAAGCTGAAC AGGATCATGT CTATTACCAT CATGCAGCCG GACAAGAGAT CATCTTGCGT 
GACTGGGATG AACCGGTCAC GGCGCAGGCG GGCGGATCAA CGTTCTATGG CGGCGATCTG 
GACGGGATAA GCGAAAAACT GCCGTATCTG AAAAAGCTTG GCGTGACGGC GCTGTATCTC 
AATCCGGTGT TTAAAGCTCC CAGCGTACAT AAATACGATA CCGAGGATTA TCGCCATGTC 
GATCCGCAGT TTGGCGGTGA TGGGGCGTTG CTGCGTTTGC GACACAATAC GCAGCAGCTG 
GGAATGCGGC TGGTGCTGGA CGGCGTGTTT AACCACAGTG GCGATTCCCA TGCCTGGTTT 
GACAGGCACA ATCGTGGCAC GGGGGGAGCT TGTCACAACC CTGAATCGCC CTGGCGCGAC 
TGGTACTCGT TTAGTGATGA TGGCACGGCG CTCGACTGGC TTGGCTATGC CAGCTTGCCG 
AAGCTGGATT ATCAGTCGGA AAGTCTGGTG AATGAAATTT ATCGCGGGGA AGACAGTATT 
GTCCGCCATT GGCTGAAAGC GCCGTGGAGT ATGGACGGCT GGCGGCTGGA TGTGGTGCAT 
ATGCTGGGGG AGGCGGGTGG GGCGCGCAAT AATATGCAGC ACGTTGCTGG GATCACCGAA 
GCGGCGAAAG AAACCCAGCC GGAAGCGTAT ATTGTCGGCG AACATTTTGG CGATGCACGG 
CAATGGTTAC AGGCCGATGT GGAAGATGCC GCCATGAACT ATCGTGGCTT CACATTCCCG 
TTGTGGGGAT TTCTTGCCAA TACCGATATC TCTTACGATC CGCAGCAAAT TGATGCCCAA 
ACCTGTATGG CCTGGATGGA TAATTACCGC GCAGGGCTTT CTCATCAACA ACAATTACGT 
ATGTTTAATC AGCTCGACAG CCACGATACT GCGCGATTTA AAACGCTGCT CGGTCGGGAT 
ATTGCGCGCC TGCCGCTGGC GGTGGTCTGG CTGTTCACCT GGCCTGGTGT ACCGTGCATT 
TATTACGGTG ATGAAGTAGG ACTGGATGGC AAAAACGATC CGTTTTGCCG TAAACCGTTC 
CCCTGGCAGG TGGAAAAGCA GGATACGGCG TTATTCGCGC TGTACCAGCG AATGATTGCG 
CTGCGTAAGA AAAGTCAGGC GCTACGTCAT GGCGGCTGTC AGGTGCTGTA TGCGGAAGAT 
AACGTGGTGG TATTTGTCCG CGTGCTGAAT CAGCAGCGTG TACTGGTGGC AATCAACCGT 
GGCGAAGCTT GTGAAGTCGT GCTACCCGCG TCACCGTTGC TCAATGCCGT GCAATGGCAA 
TGCAAAGAAG GGCATGGGCA ACTGACTGAC GGGATTCTGG CTTTGCCTGC CATTTCGGCT 
ACGGTATGGA TGAACTAA

Protein sequence

MMLNAWHLPV PPFVKQSKDQ LLITLWLTGE DPPQRIMLRT EHDNEEMSVS MHKQRSQQQP 
GVTAWRAAID LSSGQPRRRY SFKLLWHDRQ RWFTPQGFSR MPPARLEQFA VDVPDIGPQW 
AADQIFYQIF PDRFARSLPR EAEQDHVYYH HAAGQEIILR DWDEPVTAQA GGSTFYGGDL 
DGISEKLPYL KKLGVTALYL NPVFKAPSVH KYDTEDYRHV DPQFGGDGAL LRLRHNTQQL 
GMRLVLDGVF NHSGDSHAWF DRHNRGTGGA CHNPESPWRD WYSFSDDGTA LDWLGYASLP 
KLDYQSESLV NEIYRGEDSI VRHWLKAPWS MDGWRLDVVH MLGEAGGARN NMQHVAGITE 
AAKETQPEAY IVGEHFGDAR QWLQADVEDA AMNYRGFTFP LWGFLANTDI SYDPQQIDAQ 
TCMAWMDNYR AGLSHQQQLR MFNQLDSHDT ARFKTLLGRD IARLPLAVVW LFTWPGVPCI 
YYGDEVGLDG KNDPFCRKPF PWQVEKQDTA LFALYQRMIA LRKKSQALRH GGCQVLYAED 
NVVVFVRVLN QQRVLVAINR GEACEVVLPA SPLLNAVQWQ CKEGHGQLTD GILALPAISA 
TVWMN