Gene EcolC_3994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3994
Symbol
ID	6064539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4386010
End bp	4387125
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	55%
IMG OID	641603405
Product	maltose/maltodextrin transporter ATP-binding protein
Protein accession	YP_001726920
Protein GI	170021966
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.153747
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.57528
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCG TACAGCTGCA AAATGTAACG AAAGCCTGGG GCGAGGTCGT GGTATCGAAA 
GATATCAATC TCGATATCCA TGAAGGTGAA TTCGTGGTGT TTGTCGGACC GTCTGGCTGC 
GGTAAATCGA CTTTACTGCG CATGATTGCC GGGCTTGAGA CGATCACCAG CGGCGACCTG 
TTCATCGGTG AGAAACGGAT GAATGACACT CCGCCAGCAG AACGCGGCGT TGGTATGGTG 
TTTCAGTCTT ACGCGCTCTA TCCCCACCTG TCAGTAGCAG AAAACATGTC ATTTGGCCTG 
AAACTGGCTG GCGCAAAAAA AGAGGTGATT AACCAACGCG TTAACCAGGT GGCGGAAGTG 
CTACAACTGG CGCATTTGCT GGATCGCAAA CCGAAAGCGC TCTCCGGTGG TCAGCGTCAG 
CGTGTGGCGA TTGGCCGTAC GCTGGTGGCC GAGCCAAGCG TATTTTTGCT CGATGAACCG 
CTCTCCAACC TCGATGCTGC ACTGCGTGTG CAAATGCGTA TCGAAATCTC CCGTCTGCAT 
AAACGCCTGG GCCGCACAAT GATTTACGTC ACCCACGATC AGGTCGAAGC GATGACGCTG 
GCCGACAAAA TCGTGGTGCT GGACGCCGGT CGCGTGGCGC AGGTTGGGAA ACCGCTGGAG 
CTGTACCACT ATCCGGCAGA CCGTTTTGTC GCCGGATTTA TCGGTTCGCC AAAGATGAAC 
TTCCTGCCGG TAAAAGTGAC CGCCACCGCA ATCGATCAAG TGCAGGTGGA GCTGCCGATG 
CCAAATCGTC AGCAAGTCTG GCTGCCAGTT GAAAGCCGTG ATGTCCAGGT TGGAGCCAAT 
ATGTCGCTGG GTATTCGCCC GGAACATCTA CTGCCGAGTG ATATCGCTGA CGTCATCCTT 
GAGGGTGAAG TTCAGGTCGT CGAGCAACTC GGCAACGAAA CTCAAATCCA TATCCAGATC 
CCTTCCATTC GTCAAAACCT GGTGTACCGC CAGAACGACG TGGTGTTGGT AGAAGAAGGT 
GCCACATTCG CTATCGGCCT GCCGCCAGAG CGTTGCCATC TGTTCCGTGA GGATGGCACT 
GCATGTCGTC GACTGCATAA GGAGCCGGGC GTTTAA

Protein sequence

MASVQLQNVT KAWGEVVVSK DINLDIHEGE FVVFVGPSGC GKSTLLRMIA GLETITSGDL 
FIGEKRMNDT PPAERGVGMV FQSYALYPHL SVAENMSFGL KLAGAKKEVI NQRVNQVAEV 
LQLAHLLDRK PKALSGGQRQ RVAIGRTLVA EPSVFLLDEP LSNLDAALRV QMRIEISRLH 
KRLGRTMIYV THDQVEAMTL ADKIVVLDAG RVAQVGKPLE LYHYPADRFV AGFIGSPKMN 
FLPVKVTATA IDQVQVELPM PNRQQVWLPV ESRDVQVGAN MSLGIRPEHL LPSDIADVIL 
EGEVQVVEQL GNETQIHIQI PSIRQNLVYR QNDVVLVEEG ATFAIGLPPE RCHLFREDGT 
ACRRLHKEPG V