Gene SeD_A4093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4093
Symbol
ID	6875331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3941253
End bp	3942287
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	49%
IMG OID	642787042
Product	putative glycosyl transferase
Protein accession	YP_002217669
Protein GI	198244256
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATA GTAAAACCAA AGTGAGTATC ATTGTCCCGT TATATAATGC GGGAGCGGAT 
TTTAATGCTT GCATGGCGTC ATTAATCGCG CAAACGTGGT CGGCGCTGGA AATTATTATT 
GTGAATGATG GATCGACGGA TCATTCCGTT GAGATAGCAA AATATTACGC GGAACATTAC 
CCGCATGTTC GACTGCTTCA TCAGGCCAAT GCTGGCGCAT CTGTCGCCCG TAATCTTGGC 
CTGCAAGCAG CGACCGGCGA TTATGTCGCC TTTGTCGATG CAGATGACCT GGTCTACCCG 
AAGATGTATG AAACGCTGAT GACCATGGCG CTTAACGATG ATCTGGACGT TGCGCAGTGC 
AACGCGGACT GGTGCGTCCG AAAAACCGGG CACGCCTGGC AATCTATTCC GACCGATCGC 
CTGCGCTCCA CCGGGGTATT AAGCGGACCG GATTGGTTGC GTATGGCGTT GGCCTCGCGG 
CGCTGGATGC ATGTTGTCTG GATGGGCGTT TATCGACGTG CGTTAATTAC CGATAACAAT 
ATTACTTTCG TTCCCGGACT ACATCATCAG GACATATTAT GGTCGACGGA AGTTATGTTT 
AATGCCACGC GCGTACGTTA TACCGAACAA TCATTATATA AATATTTCCT GCATGATAAT 
TCGGTAAGCC GTTTGCAAAG ACAAGGCAGT AAAAATCTTA ATTACCAGCG GCATTATATT 
AAAATTACGC GGTTATTAGA AAAGCTCAAT CGTGATTATG CCCGGCGTAT TCCGATTTAC 
CCGGAGTTTC GCCAGCAAAT TACCTGGGAA GCGTTACGCG TTTGTCATGC GGTACGTAAA 
GAGCCTGATA TTTTGACCCG CCAGCGTATG ATTGCCGAAA TTTTTACTTC TGGCATGTAT 
AGACGGATGA TGGCTAACGT CCGCAGCGCG AAAGCGGCTT ATCAGACGCT GCTCTGGTCT 
TTCCGGCTGT GGCAATGGCG CGACAAAACC TTGTCACACC GTCGTATGGC CCGTAAGGCG 
CTCAATCTGT CTTAG

Protein sequence

MKNSKTKVSI IVPLYNAGAD FNACMASLIA QTWSALEIII VNDGSTDHSV EIAKYYAEHY 
PHVRLLHQAN AGASVARNLG LQAATGDYVA FVDADDLVYP KMYETLMTMA LNDDLDVAQC 
NADWCVRKTG HAWQSIPTDR LRSTGVLSGP DWLRMALASR RWMHVVWMGV YRRALITDNN 
ITFVPGLHHQ DILWSTEVMF NATRVRYTEQ SLYKYFLHDN SVSRLQRQGS KNLNYQRHYI 
KITRLLEKLN RDYARRIPIY PEFRQQITWE ALRVCHAVRK EPDILTRQRM IAEIFTSGMY 
RRMMANVRSA KAAYQTLLWS FRLWQWRDKT LSHRRMARKA LNLS