Gene SeHA_C3839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3839
Symbol
ID	6491024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3707346
End bp	3708677
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	54%
IMG OID	642743948
Product	major facilitator superfamily transporter
Protein accession	YP_002047554
Protein GI	194448126
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.993033
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.150303
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATTG AAATAGAGAA ACCGACCACA CGAGGGCGCT GGCTGCATAT TATTCCAGCC 
ACGATCCTCG TTTATATCGT GGCCTATATG GACAGGACCA ATATCGCCAT TGGGATCGCA 
GGCGGCATGG ATGAAGATTT AGGCATGACG GCTTCTTTTG CCGGTCTGGT AGCCGGGAGC 
TTCTTTATTG GTTATATCTT CCTGCAAATT CCCGGCGGTC AGATAGCCGA GCGGCTAAGC 
GCCAAAAAGT TAATTGCCTG GACAATCGTC GCCTGGGGTG GCTTTGCCCT GCTGACCGGT 
TTTGTTCAGA CACCGACGCA GTTGTTGATT ATTCGCTTTG TGCTCGGCGT GGCGGAAGGT 
GCTGTGTATC CCGCCATTCT GGCGCTGATT GGCCACTGGT TCCCAAATGA GGAGCGCGCC 
AGGGCTATCG CCTATTTCCA GATGAACCTG GCCGTCGCTT CTATTATTAC CGGGCCGCTT 
TCCGGCTGGC TTATTGAAAC CTACGGCTGG CGGGAGATGT TTATCATCGA AGGCTTGCTC 
TCTCTGGGAC TGCTCTTTGT CTGGCTACCT TTGGTTTCCG ATCACCCGCA TCAGGCAAAG 
TGGCTGGATC CGAAAGAGCG CGCCTGGATC GAACAAAAAT TGCTGGCCGA TCGCGCGTTG 
AGTATTGGCG GAGAACAAAG CAGCATTCGC GGCGTATTAA AAAGCATCAA CCTGTGGAAG 
CTTGTCGGTA TCTATTTCTT CGTACAGGTC GGCTTCTATG GCTTCGCGCT ATGGATGCCA 
AATCTGATTA AACACCTGAC CGGCAGCGGC ATGACCATCG TTGGGGTACT CACTGCGGCG 
CCTTACGTTC TATGCATCAT CGGTCAGTAT TACATCGCCA AATGGTGTGA TAAAACGATG 
AATCGCCGCC TTTACACGGC TATTCCTCTG CTGGGTTTCG CGGTCTGCCT CGCCCTCTCC 
TTATTACTGA AAGATAACGT CTGGCTCGCC TACGGCATGA TGGTTATTTG CGGGTTCTTC 
CTGCAAGCCT ATGCCGGTCC ATTCTGGACG CTGCCGCCAT TACTCTTCGC CCCCAACGTT 
CTGGGCGGCG TGCGCGGCAC GATCAACGCC CTGGGCAACA TCGGCGGCTT TATCGGTCCG 
TACCTCGTCG GGCTGTTAAC GGTGACGTTC TCGCAAACAG CAGGAATGAC CGTACTGGTT 
GCCGCCCTGC TTATCGCCGT TGGACTGCTT TTCAGCTTAC CTTCTGTTAC CGCTCGTCCT 
GCAGGTAGCA GCAACACCCC TAACACCTCG ACGCCGGGTG CGTCACTTAA ACAGGAAGGA 
ATCGCCAAAT GA

Protein sequence

MSIEIEKPTT RGRWLHIIPA TILVYIVAYM DRTNIAIGIA GGMDEDLGMT ASFAGLVAGS 
FFIGYIFLQI PGGQIAERLS AKKLIAWTIV AWGGFALLTG FVQTPTQLLI IRFVLGVAEG 
AVYPAILALI GHWFPNEERA RAIAYFQMNL AVASIITGPL SGWLIETYGW REMFIIEGLL 
SLGLLFVWLP LVSDHPHQAK WLDPKERAWI EQKLLADRAL SIGGEQSSIR GVLKSINLWK 
LVGIYFFVQV GFYGFALWMP NLIKHLTGSG MTIVGVLTAA PYVLCIIGQY YIAKWCDKTM 
NRRLYTAIPL LGFAVCLALS LLLKDNVWLA YGMMVICGFF LQAYAGPFWT LPPLLFAPNV 
LGGVRGTINA LGNIGGFIGP YLVGLLTVTF SQTAGMTVLV AALLIAVGLL FSLPSVTARP 
AGSSNTPNTS TPGASLKQEG IAK