Gene SeSA_A0047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A0047
Symbol
ID	6519460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	50450
End bp	51823
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	49%
IMG OID	642745222
Product	xylose-proton symporter
Protein accession	YP_002113054
Protein GI	194738222
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000774004
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCTG TCATTGAGGA TACCCAGCCT TCCGGGTCAG CATCATTGTC TTTACTACAG 
CGTATTAGCT ACGGCTCTTT GGATGTGGCG GGTAATCTGC TGTACTGCTT CGGTTCAACG 
TACATTTTAT ATTTCTACAC AGACGTTGCG GGCATTAGCC TTGCCGTAGC AGGCGTTATC 
CTGCTGCTGG CGCGTATTAT CGATGGCATA GACGCCCCCA TATGGGGGAT CATCATCGAT 
AAAACGCGTT CACGCTACGG TAAATGTCGT CCCTGGTTTT TATGGTTACC GCTGCCTTTT 
GCGGTATTCA GCGCGCTATC ATTTTGGTCT CCTGATATCA GTATGACAGG AAAAGCCATC 
TATGCAGCAA TATCTTATAT GATTGCCAGC ATTCTATTTA CCGGACTTAA TACACCACTC 
AGTGCAATAT TACCCCTGAT GACCTTATCT CCCAAGGAAA GACTGGTTTT AAATTCCTGG 
CGAATGACCG GTGGGCAAAT TGGGGTTTTA TTAATGAACG CGACCGCCTT GCCGTTAGTC 
GCTTTTTTAG GTAACGGTGA TGATCACGCT GGTTTTATTT ATACGGCAAT TACATTTGCC 
ATTATATCCT GCGCGCTAAC GCTCTTTGCG TTTAAAAACA TTCGTGAAAT GGATACGGAT 
AAAATACAGC ATGAACCTAA GTTGCCGATG AAAAAAAGTT TCGCGGCGAT GAAAGGTAAC 
TGGCCGTGGA TCCTGATGGT GCTGGCTAAT CTGATCTTCT GGATTGCCCT ACAGCAGCGC 
AACACGACCA TTGTCTATTA TCTGACCTAC AACCTCGACC GTAAAGATCT GGTACCGCTG 
ATTAACAGCC TGGCGACGAT TCAGATCCTG TTTATCATCG CTATCCCCTT CTTTAGCAAA 
TACCTGGCTA AAACCTGGAT ATGGGTAGGC GGTCTGCTGG TCGCCACGTT TGGCGGCGTC 
ATGATGTGGC TGGCAGCGGA CAACATTACT TTCCTCATCG CCGCCTGGAT ACTCGGCAAT 
ATCGGCAGCG GTATCGCCTG CTCAATGCCG TTTGCCATGC TGGGGTTCGC CGTCGATTTC 
GGCGCCTGGA AAACCGGTAT TAAGGCTACC GGCATTCTTA TCGCCTTCGG CAGCACCTTC 
TGCATCAAGA TGGGTAGTGG CCTCGGCACC GCTTTCGCCG CCTGGATCAT GAACAGTTTT 
GGCTATGTCC CCAACCATGC CCAGAGTGCT GCGGGTCTGG AGGGAATTAT CTGGGCCTTT 
ATCTGGGCAC CCGCCCTACT CTTCGCGCTC GCAGCGATCC CACTACTTTT CTTTCGCAAA 
TACGAAGCGA TGGAAGAGAA GATTCGCCAC GATCTGGAAA CCATCAACTC ATAA

Protein sequence

MSSVIEDTQP SGSASLSLLQ RISYGSLDVA GNLLYCFGST YILYFYTDVA GISLAVAGVI 
LLLARIIDGI DAPIWGIIID KTRSRYGKCR PWFLWLPLPF AVFSALSFWS PDISMTGKAI 
YAAISYMIAS ILFTGLNTPL SAILPLMTLS PKERLVLNSW RMTGGQIGVL LMNATALPLV 
AFLGNGDDHA GFIYTAITFA IISCALTLFA FKNIREMDTD KIQHEPKLPM KKSFAAMKGN 
WPWILMVLAN LIFWIALQQR NTTIVYYLTY NLDRKDLVPL INSLATIQIL FIIAIPFFSK 
YLAKTWIWVG GLLVATFGGV MMWLAADNIT FLIAAWILGN IGSGIACSMP FAMLGFAVDF 
GAWKTGIKAT GILIAFGSTF CIKMGSGLGT AFAAWIMNSF GYVPNHAQSA AGLEGIIWAF 
IWAPALLFAL AAIPLLFFRK YEAMEEKIRH DLETINS