Gene SNSL254_A3987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3987
Symbol
ID	6485801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3873791
End bp	3874825
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	48%
IMG OID	642739247
Product	putative glycosyl transferase
Protein accession	YP_002042957
Protein GI	194445248
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	0.993989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATA GTAAAACCAA AGTGAGTATC ATTGTCCCGT TATATAATGC GGGAGCGGAT 
TTTAATGCTT GCATGGCGTC GTTAATCGCG CAAACGTGGT CGGCGCTGGA AATTATTATT 
GTGAATGATG GATCGACAGA TCATTCCGTT GAGATAGCAA AACATTACGC GGAACATTAC 
CCACATGTTC GACTGCTTCA TCAGGCCAAT GCTGGCGCAT CTGTCGCCCG TAATCTTGGC 
CTGCAAGCGG CGACCGGCGA TTATGTCGCC TTTGTCGATG CGGATGACCA GGTCTACCCG 
AAGATGTATG AAACGCTGAT GACTATGGCG CTTAACGATG ATCTGGACGT TGCGCAGTGT 
AATGCGGACT GGTGCGTCCG AAAAACCGGG CACGCCTGGC AATCTATTCC GACCGATCGT 
CTGCGTTCCA CCGGGGTATT AAGCGGACCG GATTGGTTGC GTATGGCGTT GGCCTCGCGA 
CGCTGGACGC ATGTTGTCTG GATGGGCGTT TATCGACGTG CGTTAATTAC CGATAACAAT 
ATTACTTTCG TTCCCGGACT ACATCATCAG GACATATTAT GGTCGACGGA AGTTATGTTT 
AATGCCACGC GCGTACGTTA TACCGAACAA TCATTATATA AATATTTCCT GCATGATAAT 
TCGGTAAGCC GTTTGCAAAG ACAAGGCAAT AAAAATCTTA ATTATCAGCG GCATTATATT 
AAAATTACGC GATTATTAGA AAAGCTCAAT CGTGATTATG CCCGTCGTAT TCCGATTTAC 
CCGGAATTTC GCCAGCAAAT TACCTGGGAA GCGTTACGCG TTTGTCATGC GGTACGTAAA 
GAGCCTGATA TTTTGACCCG CCAGCGTATG ATTGCCGAAA TTTTTACTTC TGGCATGTAT 
AGACGGATGA TGGCTAACGT CCGCAGCGCG AAAGCGGCTT ATCAGACGCT GCTCTGGTCT 
TTCCGGCTGT GGCAATGGCG CGACAAAACC TTGTCGCACC GTCGTATGGC CCGTAAGGCG 
CTCAATCTGT CTTAG

Protein sequence

MKNSKTKVSI IVPLYNAGAD FNACMASLIA QTWSALEIII VNDGSTDHSV EIAKHYAEHY 
PHVRLLHQAN AGASVARNLG LQAATGDYVA FVDADDQVYP KMYETLMTMA LNDDLDVAQC 
NADWCVRKTG HAWQSIPTDR LRSTGVLSGP DWLRMALASR RWTHVVWMGV YRRALITDNN 
ITFVPGLHHQ DILWSTEVMF NATRVRYTEQ SLYKYFLHDN SVSRLQRQGN KNLNYQRHYI 
KITRLLEKLN RDYARRIPIY PEFRQQITWE ALRVCHAVRK EPDILTRQRM IAEIFTSGMY 
RRMMANVRSA KAAYQTLLWS FRLWQWRDKT LSHRRMARKA LNLS