Gene EcHS_A0907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0907
Symbol
ID	5594188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	914967
End bp	916175
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	55%
IMG OID	640920077
Product	major facilitator transporter
Protein accession	YP_001457644
Protein GI	157160326
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	0.379242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGTAA ATTCTTCACG TAATGCATTG AAACGCCGAA CCTGGGCGCT GTTTATGTTC 
TTCTTTTTGC CAGGCCTGTT AATGGCGTCC TGGGCAACCC GTACGCCTGC TATCCGCGAT 
ATTCTCTCTG TCTCGATCGC TGAAATGGGC GGTGTTCTCT TTGGTCTGTC GATCGGTTCG 
ATGAGCGGTA TTCTCTGCTC GGCGTGGTTA GTGAAACGCT TTGGGACACG TAATGTCATC 
CTGGTCACGA TGTCCTGCGC ATTGATCGGG ATGATGATAT TAAGTCTGGC ACTCTGGCTG 
ACATCGCCCC TGCTCTTTGC CGTTGGTCTC GGCGTCTTTG GGGCAAGTTT TGGTTCTGCG 
GAAGTGGCGA TAAACGTTGA AGGTGCCGCC GTTGAGCGAG AAATGAATAA AACGGTTTTG 
CCGATGATGC ACGGTTTTTA TAGCCTGGGC ACGCTGGCAG GCGCTGGTGT CGGGATGGCA 
CTGACGGCCT TTGGCGTTCC GGCAACGGTG CACATTTTAT TGGCGGCGCT GGTAGGTATC 
GCGCCTATTT ATATCGCCAT TCAGGCAATC CCTGACGGTA CGGGCAAAAA TGCTGCCGAT 
GGCACCCAGC ATGGCGAAAA AGGCGTACCT TTTTATCGCG ATATCCAGTT GCTGCTGATT 
GGTGTTGTGG TGCTGGCGAT GGCCTTTGCC GAAGGTTCTG CCAACGACTG GTTACCCTTA 
TTAATGGTTG ACGGTCACGG TTTTAGCCCC ACTTCCGGCT CGCTGATTTA TGCCGGTTTT 
ACCCTGGGGA TGACCGTTGG ACGCTTCACT GGCGGTTGGT TCATCGACCG TTACAGTCGC 
GTTGCCGTGG TTCGGGCCAG TGCGCTAATG GGGGCGTTGG GTATTGGGCT GATTATTTTT 
GTCGATAGCG CCTGGGTCGC TGGGGTGTCT GTTGTACTCT GGGGAATGGG TGCCTCGCTG 
GGCTTCCCGC TGACCATTTC TGCCGCCAGC GATACCGGCC CCGATGCACC AACCCGCGTC 
AGTGTGGTAG CAACGACCGG TTATCTGGCT TTCCTCGTCG GGCCGCCGCT GCTGGGCTAT 
CTCGGCGAAC ATTATGGATT ACGTAGTGCA ATGCTGGTTG TACTGGCGCT GGTTATTCTC 
GCGGCTATTG TCGCGAAAGC CGTCGCCAAA CCCGATACCA AAACGCAGAC GGCGATGGAG 
AATAGTTGA

Protein sequence

MTVNSSRNAL KRRTWALFMF FFLPGLLMAS WATRTPAIRD ILSVSIAEMG GVLFGLSIGS 
MSGILCSAWL VKRFGTRNVI LVTMSCALIG MMILSLALWL TSPLLFAVGL GVFGASFGSA 
EVAINVEGAA VEREMNKTVL PMMHGFYSLG TLAGAGVGMA LTAFGVPATV HILLAALVGI 
APIYIAIQAI PDGTGKNAAD GTQHGEKGVP FYRDIQLLLI GVVVLAMAFA EGSANDWLPL 
LMVDGHGFSP TSGSLIYAGF TLGMTVGRFT GGWFIDRYSR VAVVRASALM GALGIGLIIF 
VDSAWVAGVS VVLWGMGASL GFPLTISAAS DTGPDAPTRV SVVATTGYLA FLVGPPLLGY 
LGEHYGLRSA MLVVLALVIL AAIVAKAVAK PDTKTQTAME NS