Gene EcolC_3940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3940
Symbol
ID	6064439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4324492
End bp	4325472
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	53%
IMG OID	641603353
Product	D-allose transporter subunit
Protein accession	YP_001726868
Protein GI	170021914
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTTTA CCACAAGAGT AAAAAGCGAA GCGAGCGAGA AGAAACCGTT CAACTTTGCG 
CTGTTCTGGG ATAAATACGG CACCTTTTTT ATCCTGGCGA TCATCGTCGC CATCTTTGGT 
TCGCTGTCAC CAGAATATTT TCTGACCACC AATAATATTA CCCAGATTTT TGTTCAAAGC 
TCCGTGACGG TATTGATCGG CATGGGCGAG TTTTTCGCTA TCCTGGTCGC TGGTATCGAC 
CTCTCGGTTG GCGCGATTCT GGCGCTTTCC GGTATGGTGA CCGCCAAACT GATGTTGGCA 
GGTGTTGACC CGTTTCTCGC AGCGATGATT GGCGGTGTAC TGGTTGGCGG CGCACTGGGG 
GCGATCAACG GCTGCCTGGT CAACTGGACG GGGCTACACC CGTTCATCAT CACCCTTGGC 
ACCAACGCGA TTTTCCGTGG GATCACGCTG GTGATCTCCG ATGCCAACTC GGTATACGGC 
TTCTCATTTG ACTTCGTGAA CTTCTTTGCC GCCAGCGTAA TTGGGATACC TGTCCCCGTT 
ATCTTCTCGC TAATTGTCGC GCTCATCCTT TGGTTTCTGA CAACGCGTAT GCGGCTCGGG 
CGCAACATCT ACGCACTGGG CGGCAACAAA AATTCGGCGT TCTATTCCGG GATTGACGTG 
AAATTCCACA TCCTGGTGGT GTTTATCATC TCCGGTGTTT GTGCAGGTCT GGCAGGCGTC 
GTCTCAACTG CACGACTCGG TGCCGCAGAA CCGCTTGCCG GTATGGGTTT TGAAACCTAT 
GCCATTGCCA GCGCCATCAT TGGCGGCACC AGTTTCTTCG GCGGCAAGGG GCGCATTTTC 
TCTGTGGTGA TTGGCGGGTT GATCATCGGC ACCATCAACA ACGGTCTGAA TATTTTGCAG 
GTACAAACCT ATTACCAACT GGTGGTGATG GGCGGATTAA TTATCGCGGC TGTCGCCCTT 
GACCGTCTTA TCAGTAAGTA A

Protein sequence

MGFTTRVKSE ASEKKPFNFA LFWDKYGTFF ILAIIVAIFG SLSPEYFLTT NNITQIFVQS 
SVTVLIGMGE FFAILVAGID LSVGAILALS GMVTAKLMLA GVDPFLAAMI GGVLVGGALG 
AINGCLVNWT GLHPFIITLG TNAIFRGITL VISDANSVYG FSFDFVNFFA ASVIGIPVPV 
IFSLIVALIL WFLTTRMRLG RNIYALGGNK NSAFYSGIDV KFHILVVFII SGVCAGLAGV 
VSTARLGAAE PLAGMGFETY AIASAIIGGT SFFGGKGRIF SVVIGGLIIG TINNGLNILQ 
VQTYYQLVVM GGLIIAAVAL DRLISK