Gene SeD_A3841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3841
Symbol	tsgA
ID	6874582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3662869
End bp	3664050
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	55%
IMG OID	642786806
Product	hypothetical protein
Protein accession	YP_002217434
Protein GI	198245921
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.933183
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAACA GCAACCGCAT CAAGCTCACA TGGATCAGCT TTCTTTCCTA CGCCCTGACC 
GGGGCGCTGG TGATTGTCAC CGGGATGGTG ATGGGAAATA TCGCAGACTA TTTTCATCTG 
CCCGTTTCCA GCATGAGTAA CACCTTTACT TTTCTGAACG CCGGGATTTT GATCTCGATC 
TTCCTCAACG CGTGGCTGAT GGAAATCGTC CCGCTGAAAA CACAGCTACG CTTTGGTTTT 
ATCCTGATGG TGCTGGCGGT GGCCGGGCTG ATGTTCAGCC ATAGCCTGGC GTTGTTCTCA 
GCGGCGATGT TTGTGCTGGG GCTGGTCAGC GGGATCACCA TGTCGATTGG CACCTTCCTG 
ATTACGCAAC TGTATGAAGG GCGTCAGCGC GGTTCCCGAC TGCTGTTTAC CGACTCCTTC 
TTCAGCATGG CGGGGATGAT TTTTCCTATG GTCGCCGCCT TCCTGCTGGC GCGTAGTATT 
GAGTGGTACT GGGTCTACGC CTGCATCGGC CTGGTCTACC TGGCGATTTT CATCCTGACC 
TTCGGCTGTG AATTTCCGGC GCTGGGTAAA CATGCGCAGC ACTCTCAGGC GCCTGTCGCC 
AAAGAAAAAT GGGGCATTGG CGTACTGTTT CTGGCCGTCG CCGCGCTGTG CTATATCCTC 
GGTCAATTAG GCTTTATCTC CTGGGTGCCG GAATACGCCA AAGGCCTCGG CATGAGCCTG 
AATGACGCCG GGGCGCTGGT GAGTGATTTC TGGATGTCCT ATATGTTTGG CATGTGGGCG 
TTCAGCTTTA TCCTGCGCTT TTTCGATCTG CAACGCATTC TGACCGTACT GGCGGGTATG 
GCGGCGGTAC TGATGTATCT GTTTATTACC GGCACGCAGG CGCATATGCC GTGGTTTATT 
CTGACGCTGG GCTTCTTCTC CAGCGCCATT TATACCTCCA TCATTACGCT GGGATCGCAG 
CAAACGAAAG TGGCCTCGCC TAAGCTGGTT AACTTTATTC TGACCTGCGG CACTATCGGA 
ACGATGCTGA CCTTCGTCGT CACCGGCCCG ATTGTAGCGC ACAGCGGCCC ACAGGCGGCG 
TTACTCACCG CGAATGGTCT GTATGCAGTG GTCTTTGTGA TGTGCTTTGC GCTCGGCTTT 
GTCTCCCGTC ATCGTCAGCA TAGCGCGCCG GCTACGCATT GA

Protein sequence

MTNSNRIKLT WISFLSYALT GALVIVTGMV MGNIADYFHL PVSSMSNTFT FLNAGILISI 
FLNAWLMEIV PLKTQLRFGF ILMVLAVAGL MFSHSLALFS AAMFVLGLVS GITMSIGTFL 
ITQLYEGRQR GSRLLFTDSF FSMAGMIFPM VAAFLLARSI EWYWVYACIG LVYLAIFILT 
FGCEFPALGK HAQHSQAPVA KEKWGIGVLF LAVAALCYIL GQLGFISWVP EYAKGLGMSL 
NDAGALVSDF WMSYMFGMWA FSFILRFFDL QRILTVLAGM AAVLMYLFIT GTQAHMPWFI 
LTLGFFSSAI YTSIITLGSQ QTKVASPKLV NFILTCGTIG TMLTFVVTGP IVAHSGPQAA 
LLTANGLYAV VFVMCFALGF VSRHRQHSAP ATH