Gene SNSL254_A1720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1720
Symbol
ID	6486041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1692659
End bp	1693837
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	57%
IMG OID	642737100
Product	benzoate transporter
Protein accession	YP_002040852
Protein GI	194446451
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3135] Uncharacterized protein involved in benzoate metabolism
TIGRFAM ID	[TIGR00843] benzoate transporter

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTGT TATCACTGCC GTTACCTACT GTATTATCTG GTCTGGTCGC CGTTCTGGTC 
GGCTATGCGA GTTCCGCCGC CATTATCTGG CAGGCGGCGC TTGCCGCTGG CGCAACACCC 
ACAGAGATCG CCGGCTGGAT GACCGCCCTC GGTATAGCCA TGGGCATAAG CACACTAACG 
TTAACCTTGT GGTATCGTGC GCCGGTTTTA ACCGCTTGGT CAACGCCTGG TGCCGCCCTG 
TTGGTAACAG GGCTTCAGGG ATTATCGTTG CCAGACGCCG TGGGCATATT CATTGTCGCC 
AATGCCCTGA TTGTGCTGTG CGGCGTCACG GGATTGTTTG CGCGTTTGAT GCGGATAATC 
CCCCATTCTC TTGCCGCTGC AATGCTGGCG GGAATACTGC TACGCTTCGG CCTGCAGGCG 
TTCGGGACGC TCAATGGAGA ATTTGTCATG TGCGGCGGTA TGCTATTGGC GTGGCTACTC 
TTTAAAGTAT TCGCGCCCCG CTATGCCGTT ATTGCTGCCA TGGTGATGGG AATAACGGTG 
GCGCTCATCC AGGGTAAGGT GGCGATGAGC GGTATTCATT TCGCGCCGGT GTGGCCCACC 
TTCGTTCCCC CCCACTTTTC ATTCGCTCAA AGCCTGAGCG TCGCGGTACC GCTCTTCCTG 
GTGACGATGG CATCGCAAAA CGCCCCCGGC GTCGCCACAA TGAAGGCGTC TGGCTATCAG 
CTTCCTGTCT CTCCGTTAAT GATTTTTACC GGATTGCTGG CGCTGCTGCT TTCGCCATTT 
GGCGTTTATT CTATCTGCAT TGCCGCCATT ACAGCCGCCA TTTGTCAAAG CCCGGACGCG 
CACCCCGATC CAACGCGTCG CTGGTTAGCG GCCGCCGCCG CAGGCGTTTT TTATTTACTT 
GCCGGGTGGT TTGGCGGTTC GATAACCGGG CTGATGGTCG CCCTGCCGGT TAGCTGGGTG 
CAAATGCTGG CTGGTCTGGC ACTGTTAAGT ACGATTAGCG GTAGCCTGTA TCAGGCGCTT 
ACTCACGAAA GTGAGCGTGA CGCGGCAGTT ATCGCATTTC TCGTCACCGC CAGCGGGCTA 
ACGCTGATGG GCATCGGATC GGCATTCTGG GGGTTGATCG CTGGCGGGAT AGGCTATGCA 
GTATTAACGA GAACGCGCCG CCCATCGTTG TCTGGCTGA

Protein sequence

MRLLSLPLPT VLSGLVAVLV GYASSAAIIW QAALAAGATP TEIAGWMTAL GIAMGISTLT 
LTLWYRAPVL TAWSTPGAAL LVTGLQGLSL PDAVGIFIVA NALIVLCGVT GLFARLMRII 
PHSLAAAMLA GILLRFGLQA FGTLNGEFVM CGGMLLAWLL FKVFAPRYAV IAAMVMGITV 
ALIQGKVAMS GIHFAPVWPT FVPPHFSFAQ SLSVAVPLFL VTMASQNAPG VATMKASGYQ 
LPVSPLMIFT GLLALLLSPF GVYSICIAAI TAAICQSPDA HPDPTRRWLA AAAAGVFYLL 
AGWFGGSITG LMVALPVSWV QMLAGLALLS TISGSLYQAL THESERDAAV IAFLVTASGL 
TLMGIGSAFW GLIAGGIGYA VLTRTRRPSL SG