Gene EcHS_A2945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2945
Symbol	fucP
ID	5593999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2952444
End bp	2953760
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	48%
IMG OID	640922063
Product	L-fucose transporter
Protein accession	YP_001459573
Protein GI	157162255
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID	[TIGR00885] L-fucose:H+ symporter permease

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	0.824406
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAACA CATCAATACA AACGCAGAGT TACCGTGCGG TAGATAAAGA TGCAGGGCAA 
AGCAGAAGTT ACATTATTCC ATTCGCGCTG CTGTGCTCAC TGTTTTTTCT TTGGGCGGTA 
GCCAATAACC TTAACGACAT TTTATTACCT CAATTCCAGC AGGCTTTTAC GCTGACAAAT 
TTCCAGGCTG GCCTGATCCA ATCGGCCTTT TACTTTGGTT ATTTCATTAT CCCAATCCCT 
GCTGGGATAT TGATGAAAAA ACTCAGTTAT AAAGCAGGGA TTATTACCGG ATTATTTTTA 
TATGCCTTGG GCGCTGCATT ATTCTGGCCC GCTGCAGAAA TAATGAACTA CACCTTATTT 
TTAGTTGGCC TATTTATTAT TGCAGCCGGA TTAGGTTGTC TGGAAACTGC CGCAAACCCT 
TTTGTTACGG TATTAGGGCC GGAAAGCAGT GGTCACTTCC GCTTAAATCT TGCGCAAACA 
TTTAACTCGT TTGGCGCAAT TATCGCGGTT GTCTTTGGGC AAAGTCTTAT TTTGTCTAAC 
GTGCCACATC AATCGCAAGA CGTTCTCGAT AAAATGTCTC CAGAGCAATT GAGTGCGTAT 
AAACACAGCC TGGTATTATC GGTACAGACA CCTTATATGA TCATCGTGGC TATCGTGTTA 
CTGGTCGCCC TGCTGATCAT GCTGACGAAA TTCCCGGCAT TGCAGAGTGA TAATCACAGT 
GACGCCAAAC AAGGATCGTT CTCCGCATCG CTTTCTCGTC TGGCGCGTAT TCGTCACTGG 
CGCTGGGCGG TATTAGCGCA ATTCTGCTAT GTCGGCGCAC AAACGGCCTG CTGGAGCTAT 
TTGATTCGCT ACGCTGTAGA AGAAATTCCA GGTATGACTG CAGGCTTTGC CGCTAACTAT 
TTAACCGGAA CCATGGTGTG CTTCTTTATT GGTCGTTTCA CCGGTACCTG GCTCATCAGT 
CGCTTCGCAC CACACAAAGT CCTGGCCGCC TACGCATTAA TCGCTATGGC ACTGTGCCTG 
ATCTCAGCCT TCGCTGGCGG TCATGTGGGC TTAATAGCCC TGACTTTATG CAGCGCCTTT 
ATGTCGATTC AGTACCCAAC AATCTTCTCG CTGGGCATTA AGAATCTCGG CCAGGACACC 
AAATACGGTT CGTCCTTCAT CGTTATGACC ATCATTGGCG GCGGTATTGT CACTCCGGTC 
ATGGGTTTTG TCAGTGACGC GGCGGGCAAC ATCCCCACTG CTGAACTGAT CCCCGCACTC 
TGCTTCGCGG TCATCTTTAT CTTTGCCCGT TTCCGTTCTC AAACGGCAAC TAACTGA

Protein sequence

MGNTSIQTQS YRAVDKDAGQ SRSYIIPFAL LCSLFFLWAV ANNLNDILLP QFQQAFTLTN 
FQAGLIQSAF YFGYFIIPIP AGILMKKLSY KAGIITGLFL YALGAALFWP AAEIMNYTLF 
LVGLFIIAAG LGCLETAANP FVTVLGPESS GHFRLNLAQT FNSFGAIIAV VFGQSLILSN 
VPHQSQDVLD KMSPEQLSAY KHSLVLSVQT PYMIIVAIVL LVALLIMLTK FPALQSDNHS 
DAKQGSFSAS LSRLARIRHW RWAVLAQFCY VGAQTACWSY LIRYAVEEIP GMTAGFAANY 
LTGTMVCFFI GRFTGTWLIS RFAPHKVLAA YALIAMALCL ISAFAGGHVG LIALTLCSAF 
MSIQYPTIFS LGIKNLGQDT KYGSSFIVMT IIGGGIVTPV MGFVSDAAGN IPTAELIPAL 
CFAVIFIFAR FRSQTATN