Gene EcSMS35_4497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4497
Symbol	malK
ID	6143777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4594334
End bp	4595449
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	55%
IMG OID	641619313
Product	maltose/maltodextrin transporter ATP-binding protein
Protein accession	YP_001746425
Protein GI	170683568
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCG TACAGCTGCA AAATGTAACG AAAGCCTGGG GCGAGGTCGT GGTATCGAAA 
GATATCAATC TCGATATCCA TGAAGGTGAA TTCGTGGTGT TTGTCGGACC GTCTGGCTGC 
GGTAAGTCGA CTTTACTGCG CATGATTGCC GGGCTTGAGA CGATCACCAG CGGCGACCTG 
TTCATCGGTG AGAAACGGAT GAATGACACT CCGCCAGCAG AACGCGGCGT TGGTATGGTG 
TTTCAGTCTT ACGCGCTCTA TCCCCACCTG TCAGTAGCAG AAAACATGTC ATTTGGCCTG 
AAACTGGCAG GCGCAAAAAA AGAGGTGATT AACCAACGCG TCAACCAGGT AGCGGAAGTG 
CTGCAACTGG CGCATTTGCT GGATCGCAAA CCGAAAGCGC TCTCCGGTGG TCAGCGTCAG 
CGTGTGGCGA TTGGCCGTAC GCTGGTGGCC GAGCCAAGCG TATTTTTGCT CGATGAACCG 
CTCTCCAACC TCGATGCTGC ACTGCGTGTG CAAATGCGTA TCGAAATCTC CCGTCTGCAT 
AAACGCCTGG GCCGCACAAT GATTTACGTC ACCCACGATC AGGTCGAAGC GATGACGCTG 
GCCGACAAAA TCGTGGTGCT GGACGCTGGT CGCGTGGCGC AGGTTGGGAA ACCGCTGGAG 
CTGTACCACT ATCCGGCAGA CCGTTTTGTC GCCGGATTTA TCGGTTCGCC AAAGATGAAC 
TTCCTGCCAG TAAAAGTGAC CGCCACTGCA ATCGATCAAG TGCAGGTGGA GCTGCCGATG 
CCAAATCGTC AGCAAGTCTG GCTGCCGGTT GAAAGCCGTG ATGTCCAGGT TGGAGCCAAT 
ATGTCGCTGG GTATTCGCCC GGAACATCTA CTGCCGAGTG ATATCGCTGA CGTCATCCTT 
GAGGGTGAAG TTCAGGTCGT CGAGCAACTC GGCAACGAAA CCCAAATCCA TATCCAGATC 
CCTTCCATTC GTCAAAACCT GGTGTACCGC CAGAACGACG TGGTGTTGGT AGAAGAAGGT 
GCCACATTCG CTATCGGCCT GCCGCCAGAG CGTTGCCATC TGTTCCGTGA GGATGGCACT 
GCATGTCGTC GACTGCATAA GGAGCCGGGC GTTTAA

Protein sequence

MASVQLQNVT KAWGEVVVSK DINLDIHEGE FVVFVGPSGC GKSTLLRMIA GLETITSGDL 
FIGEKRMNDT PPAERGVGMV FQSYALYPHL SVAENMSFGL KLAGAKKEVI NQRVNQVAEV 
LQLAHLLDRK PKALSGGQRQ RVAIGRTLVA EPSVFLLDEP LSNLDAALRV QMRIEISRLH 
KRLGRTMIYV THDQVEAMTL ADKIVVLDAG RVAQVGKPLE LYHYPADRFV AGFIGSPKMN 
FLPVKVTATA IDQVQVELPM PNRQQVWLPV ESRDVQVGAN MSLGIRPEHL LPSDIADVIL 
EGEVQVVEQL GNETQIHIQI PSIRQNLVYR QNDVVLVEEG ATFAIGLPPE RCHLFREDGT 
ACRRLHKEPG V