Gene EcHS_A4275 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4275
Symbol	malK
ID	5594201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4278528
End bp	4279643
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	55%
IMG OID	640923377
Product	maltose/maltodextrin transporter ATP-binding protein
Protein accession	YP_001460822
Protein GI	157163504
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGAGCG TACAGCTGCA AAATGTAACG AAAGCCTGGG GCGAGGTCGT GGTATCGAAA 
GATATCAATC TCGATATCCA TGAAGGTGAA TTCGTGGTGT TTGTCGGACC GTCTGGCTGC 
GGTAAATCGA CTTTACTGCG CATGATTGCC GGGCTTGAGA CGATCACCAG CGGCGACCTG 
TTCATCGGTG AGAAACGGAT GAATGACACT CCGCCAGCAG AACGCGGCGT TGGTATGGTG 
TTTCAGTCTT ACGCGCTCTA TCCCCACCTG TCAGTAGCAG AAAATATGTC ATTTGGCCTG 
AAACTGGCAG GCGCAAAAAA AGAGGTGATT AACCAACGCG TTAACCAGGT GGCGGAAGTG 
CTGCAACTGG CGCATTTGCT GGATCGCAAA CCGAAAGCGC TCTCTGGCGG TCAGCGTCAG 
CGTGTGGCGA TTGGCCGTAC GCTGGTGGCC GAGCCAAGCG TATTTTTGCT CGATGAACCG 
CTCTCCAACC TCGATGCTGC ACTGCGTGTG CAAATGCGTA TCGAAATCTC CCGTCTGCAT 
AAACGCCTGG GCCGCACAAT GATTTACGTC ACCCACGATC AGGTCGAAGC GATGACGCTG 
GCCGACAAAA TCGTGGTGCT GGACGCCGGT CGCGTGGCGC AGGTTGGGAA ACCGCTGGAG 
CTGTACCACT ATCCGGCAGA CCGTTTTGTC GCCGGATTTA TCGGTTCGCC AAAGATGAAC 
TTCCTGCCGG TAAAAGTGAC CGCCACCGCA ATCGATCAAG TGCAGGTGGA GCTGCCGATG 
CCAAATCGTC AGCAAGTCTG GCTGCCAGTT GAAAGCCGTG ATGTCCAGGT TGGAGCCAAT 
ATGTCGCTGG GTATTCGCCC GGAACATCTA CTGCCGAGTG ATATCGCTGA CGTCATCCTT 
GAGGGTGAAG TTCAGGTCGT CGAGCAACTC GGCAACGAAA CCCAAATCCA TATCCAGATC 
CCTTCCATTC GTCAAAACCT GGTGTACCGC CAGAACGACG TGGTGTTGGT AGAAGAAGGT 
GCCACATTCG CTATCGGCCT GCCGCCAGAG CGTTGCCATC TGTTCCGTGA GGATGGCACT 
GCATGTCGTC GACTGCATAA GGAGCCGGGC GTTTAA

Protein sequence

MASVQLQNVT KAWGEVVVSK DINLDIHEGE FVVFVGPSGC GKSTLLRMIA GLETITSGDL 
FIGEKRMNDT PPAERGVGMV FQSYALYPHL SVAENMSFGL KLAGAKKEVI NQRVNQVAEV 
LQLAHLLDRK PKALSGGQRQ RVAIGRTLVA EPSVFLLDEP LSNLDAALRV QMRIEISRLH 
KRLGRTMIYV THDQVEAMTL ADKIVVLDAG RVAQVGKPLE LYHYPADRFV AGFIGSPKMN 
FLPVKVTATA IDQVQVELPM PNRQQVWLPV ESRDVQVGAN MSLGIRPEHL LPSDIADVIL 
EGEVQVVEQL GNETQIHIQI PSIRQNLVYR QNDVVLVEEG ATFAIGLPPE RCHLFREDGT 
ACRRLHKEPG V