Gene SeHA_C3778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3778
Symbol	tsgA
ID	6488339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3636365
End bp	3637546
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	55%
IMG OID	642743890
Product	hypothetical protein
Protein accession	YP_002047496
Protein GI	194447901
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	0.974681
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAACA GCAACCGCAT CAAGCTCACA TGGATCAGCT TTCTTTCCTA CGCCCTGACC 
GGGGCGCTGG TGATTGTCAC CGGGATGGTG ATGGGAAATA TCGCAGACTA TTTTCATCTG 
CCCGTTTCCA GCATGAGTAA CACCTTTACT TTCCTGAATG CCGGGATTTT GATCTCGATC 
TTCCTCAATG CGTGGCTGAT GGAAATCGTC CCGCTGAAAA CACAGCTACG CTTTGGTTTT 
ATCCTGATGG TGCTGGCGGT GGCCGGGCTG ATGTTCAGCC ATAGCCTGGC GTTGTTCTCA 
GCGGCGATGT TTGTGCTGGG GCTGGTCAGC GGGATCACCA TGTCGATTGG CACCTTCCTG 
ATTACGCAAC TGTATGAAGG GCGTCAGCGC GGTTCCCGAC TGCTGTTTAC CGACTCCTTC 
TTCAGCATGG CGGGAATGAT TTTTCCTATG GTCGCCGCCT TCCTGCTGGC GCGTAGTATT 
GAGTGGTACT GGGTCTACGC CTGCATCGGC CTGGTCTACC TGGCGATTTT CATCCTGACC 
TTCGGCTGTG AATTTCCGGC GCTGGGTAAA CATGCGCAGC ACTCTCAGGC GCCTGTCGTC 
AAAGAAAAAT GGGGCATTGG CGTACTGTTT CTCGCCGTCG CCGCGCTGTG CTATATCCTC 
GGTCAATTAG GCTTTATCTC CTGGGTGCCG GAATACGCCA AAGGCCTCGG CATGAGCCTG 
AATGACGCCG GGGCGCTGGT GAGTGATTTC TGGATGTCCT ATATGTTTGG CATGTGGGCG 
TTCAGCTTTA TCCTGCGCTT TTTCGATCTG CAACGCATTC TGACCGTACT GGCGGGTATG 
GCGGCGGTAC TGATGTATCT GTTTATTACC GGCACGCAGG CGCATATGCC GTGGTTTATT 
CTGACGCTGG GCTTCTTCTC CAGCGCCATT TATACCTCCA TCATTACGCT GGGATCGCAG 
CAAACGAAAG TGGCCTCGCC TAAGCTGGTT AACTTTATTC TGACCTGCGG CACTATCGGA 
ACGATGCTGA CCTTCGTCGT CACCGGCCCG ATTGTGGCGC ACAGCGGCCC ACAGGCGGCG 
TTACTCACCG CGAATGGTCT GTATGCGGTG GTCTTTGTGA TGTGCTTTGC GCTCGGCTTT 
GTCTCCCGTC ATCGTCAGCA TAGCGCGCCG GCTACGCATT GA

Protein sequence

MTNSNRIKLT WISFLSYALT GALVIVTGMV MGNIADYFHL PVSSMSNTFT FLNAGILISI 
FLNAWLMEIV PLKTQLRFGF ILMVLAVAGL MFSHSLALFS AAMFVLGLVS GITMSIGTFL 
ITQLYEGRQR GSRLLFTDSF FSMAGMIFPM VAAFLLARSI EWYWVYACIG LVYLAIFILT 
FGCEFPALGK HAQHSQAPVV KEKWGIGVLF LAVAALCYIL GQLGFISWVP EYAKGLGMSL 
NDAGALVSDF WMSYMFGMWA FSFILRFFDL QRILTVLAGM AAVLMYLFIT GTQAHMPWFI 
LTLGFFSSAI YTSIITLGSQ QTKVASPKLV NFILTCGTIG TMLTFVVTGP IVAHSGPQAA 
LLTANGLYAV VFVMCFALGF VSRHRQHSAP ATH