Gene SeHA_C1066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1066
Symbol
ID	6488469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	1053999
End bp	1055147
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	52%
IMG OID	642741308
Product	putative MFS family transporter protein
Protein accession	YP_002044960
Protein GI	194448266
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0109071
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	0.857423
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACCT ATACCCGTCC CGTCATGCTT TTGCTGTGCG GGCTACTTTT GTTGACTCTG 
GCCATTGCGG TACTGAATAC GCTTGTGCCG CTGTGGCTTG CTCAGGCAAA CCTTCCGACC 
TGGCAGGTGG GGATGGTCAG CTCGTCTTAT TTTACCGGCA ATCTGGTCGG GACGTTATTT 
ACCGGGTATT TAATTAAACG CATTGGGTTT AACCGTAGCT ATTATCTTGC CTCGCTGATC 
TTCGCCGCGG GTTGTGTCGG ATTGGGGGTG ATGGTGGGGT TCTGGAGCTG GATGAGCTGG 
CGTTTTATTG CCGGTATCGG CTGCGCCATG ATTTGGGTGG TTGTCGAAAG CGCGTTGATG 
TGCAGCGGAA CCTCGCATAA TCGCGGGCGC CTGCTGGCTG CCTATATGAT GGTCTATTAC 
ATGGGGACCT TCCTTGGACA ATTATTGGTC AGTAAAGTAT CTGGTGAATT GCTGCACGTC 
CTTCCCTGGG TGACCGGAAT GATTCTGGCG GGAATTCTGC CGCTACTCTT TACCCGAATT 
GTAAATCAGC AAACGCAGAC ACGTCATTCC TCTTCTATTA GCGCCATGCT GAAGCTACGC 
CAGGCGCGTC TTGGCGTGAA TGGTTGCATT ATTTCCGGCA TTGTTCTTGG TTCATTATAT 
GGCCTGATGC CGTTATATCT GAAGCATCAG GGGATGGCTA ACGCCAGCAT CGGTTTCTGG 
ATGGCGGTGC TGGTGAGCGC CGGCATTTTG GGGCAATGGC CAATGGGACG TCTGGCGGAC 
AAATTTGGTC GCTTGCTGGT ATTACGCGTA CAGGTATTCG TTGTCATACT CGGTAGTATT 
GCCATGTTAA CCCAGGCGGC GATGGCGCCA GCTCTGTTTA TTCTGGGGGC GGCGGGTTTT 
ACGCTTTATC CCGTCGCAAT GGCCTGGGCC TGTGAAAAAG TCGAACATCA CCAGCTTGTG 
GCAATGAACC AGGCGCTGTT GTTAAGTTAT ACGGTAGGGA GCCTGTTGGG GCCGTCTTTT 
GCTGCGATGT TAATGCAGAA TTATTCAGAT AATCTGCTGT TTATTATGAT CGCCAGCGTA 
TCGTTTATTT ATCTGCTGAT GCTGTTACGT AACGCCGGCC AGACGCCTAA TCCTGTCGCC 
CACATCTAA

Protein sequence

MSTYTRPVML LLCGLLLLTL AIAVLNTLVP LWLAQANLPT WQVGMVSSSY FTGNLVGTLF 
TGYLIKRIGF NRSYYLASLI FAAGCVGLGV MVGFWSWMSW RFIAGIGCAM IWVVVESALM 
CSGTSHNRGR LLAAYMMVYY MGTFLGQLLV SKVSGELLHV LPWVTGMILA GILPLLFTRI 
VNQQTQTRHS SSISAMLKLR QARLGVNGCI ISGIVLGSLY GLMPLYLKHQ GMANASIGFW 
MAVLVSAGIL GQWPMGRLAD KFGRLLVLRV QVFVVILGSI AMLTQAAMAP ALFILGAAGF 
TLYPVAMAWA CEKVEHHQLV AMNQALLLSY TVGSLLGPSF AAMLMQNYSD NLLFIMIASV 
SFIYLLMLLR NAGQTPNPVA HI