Gene ECD_03907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03907
Symbol	malK
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	4154156
End bp	4155271
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	55%
IMG OID
Product	fused maltose transport subunit, ATP-binding component of ABC superfamily/regulatory protein
Protein accession	ACT45698
Protein GI	253980028
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGAGCG TACAGCTGCA AAATGTAACG AAAGCCTGGG GCGAGGTCGT GGTATCGAAA 
GATATCAATC TCGATATCCA TGAAGGTGAA TTCGTGGTGT TTGTCGGACC GTCTGGCTGC 
GGTAAATCGA CTTTACTGCG CATGATTGCC GGGCTTGAGA CGATCACCAG CGGCGACCTG 
TTCATCGGTG AGAAACGGAT GAATGACACT CCGCCAGCAG AACGCGGCGT TGGTATGGTG 
TTTCAGTCTT ACGCGCTCTA TCCCCACCTG TCAGTAGCAG AAAACATGTC ATTTGGCCTG 
AAACTGGCTG GCGCAAAAAA AGAGGTGATT AACCAACGCG TTAACCAGGT GGCGGAAGTG 
CTACAACTGG CGCATTTGCT GGATCGCAAA CCGAAAGCGC TCTCCGGTGG TCAGCGTCAG 
CGTGTGGCGA TTGGCCGTAC GCTGGTGGCC GAGCCAAGCG TATTTTTGCT CGATGAACCG 
CTCTCCAACC TCGATGCTGC ACTGCGTGTG CAAATGCGTA TCGAAATCTC CCGTCTGCAT 
AAACGCCTGG GCCGCACAAT GATTTACGTC ACCCACGATC AGGTCGAAGC GATGACGCTG 
GCCGACAAAA TCGTGGTGCT GGACGCCGGT CGCGTGGCGC AGGTTGGGAA ACCGCTGGAG 
CTGTACCACT ATCCGGCAGA CCGTTTTGTC GCCGGATTTA TCGGTTCGCC AAAGATGAAC 
TTCCTGCCGG TAAAAGTGAC CGCCACCGCA ATCGATCAAG TGCAGGTGGA GCTGCCGATG 
CCAAATCGTC AGCAAGTCTG GCTGCCAGTT GAAAGCCGTG ATGTCCAGGT TGGAGCCAAT 
ATGTCGCTGG GTATTCGCCC GGAACATCTA CTGCCGAGTG ATATCGCTGA CGTCATCCTT 
GAGGGTGAAG TTCAGGTCGT CGAGCAACTC GGCAACGAAA CTCAAATCCA TATCCAGATC 
CCTTCCATTC GTCAAAACCT GGTGTACCGC CAGAACGACG TGGTGTTGGT AGAAGAAGGT 
GCCACATTCG CTATCGGCCT GCCGCCAGAG CGTTGCCATC TGTTCCGTGA GGATGGCACT 
GCATGTCGTC GACTGCATAA GGAGCCGGGC GTTTAA

Protein sequence

MASVQLQNVT KAWGEVVVSK DINLDIHEGE FVVFVGPSGC GKSTLLRMIA GLETITSGDL 
FIGEKRMNDT PPAERGVGMV FQSYALYPHL SVAENMSFGL KLAGAKKEVI NQRVNQVAEV 
LQLAHLLDRK PKALSGGQRQ RVAIGRTLVA EPSVFLLDEP LSNLDAALRV QMRIEISRLH 
KRLGRTMIYV THDQVEAMTL ADKIVVLDAG RVAQVGKPLE LYHYPADRFV AGFIGSPKMN 
FLPVKVTATA IDQVQVELPM PNRQQVWLPV ESRDVQVGAN MSLGIRPEHL LPSDIADVIL 
EGEVQVVEQL GNETQIHIQI PSIRQNLVYR QNDVVLVEEG ATFAIGLPPE RCHLFREDGT 
ACRRLHKEPG V