Gene SeHA_C4032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4032
Symbol
ID	6489352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3914364
End bp	3915398
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	48%
IMG OID	642744133
Product	putative glycosyl transferase
Protein accession	YP_002047738
Protein GI	194449258
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0315657
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	80
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATA GTAAAACCAA AGTGAGTATC ATTGTCCCGT TATATAATGC GGGAGCGGAT 
TTTAATGCTT GCATGGCGTC GTTAATCGCG CAAACGTGGT CGGCGCTGGA AATTATTATT 
GTGAATGATG GATCGACGGA TCATTCCGTT GAGATAGCAA AACATTACGC GGAACATTAC 
CCACATGTTC GACTGCTTCA TCAGGCCAAT GCTGGCGCAT CTGTCGCCCG TAATCTTGGC 
CTGCAAGCGG CGACCGGCGA TTATGTCGCC TTTGTCGATG CGGATGACCA GGTCTACCCG 
AAGATGTATG AAACGCTGAT GACTATGGCG CTTAACGATG ATCTGGACGT TGCGCAGTGT 
AATGCGGACT GGTGCGTCCG AAAAACCGGG CACGCCTGGC AATCTATTCC GACCGATCGT 
CTGCGTTCCA CCGGGGTATT AAGCGGACCG GATTGGTTGC GTATGGCGTT GGCCTCGCGG 
CGCTGGACGC ATGTTGTCTG GATGGGCGTT TATCGACGTG CGTTAATTAC CGATAACAAT 
ATTACTTTCG TTCCCGGACT ACATCATCAG GACATATTAT GGTCGACGGA AGTTATGTTT 
AATGCCACGC GCGTACGTTA TACCGAACAA TCATTATATA AATATTTCCT GCATGATAAT 
TCGGTAAGCC GTTTGCAAAG ACAAGGCAAT AAAAATCTTA ATTATCAGCG GCATTATATT 
AAAATTACGC GATTATTAGA AAAGCTCAAT CGTGATTATG CCCGTCGTAT TCCGATTTAC 
CCGGAATTTC GCCAGCAAAT TACCTGGGAA GCGTTACGCG TTTGTCATGC GGTACGTAAA 
GAGCCTGATA TTTTGACCCG CCAGCGTATG ATTGCCGAAA TTTTTACTTC TGGCATGTAT 
AGACGGATGA TGGCTAACGT CCGCAGCGCG AAAGCAGCTT ATCAGACGCT GCTCTGGTCC 
TTCCGGCTGT GGCAATGGCG CGACAAAACC TTGTCGCACC GTCGTATGGC CCGTAAGGCG 
CTCAATCTGT CTTAG

Protein sequence

MKNSKTKVSI IVPLYNAGAD FNACMASLIA QTWSALEIII VNDGSTDHSV EIAKHYAEHY 
PHVRLLHQAN AGASVARNLG LQAATGDYVA FVDADDQVYP KMYETLMTMA LNDDLDVAQC 
NADWCVRKTG HAWQSIPTDR LRSTGVLSGP DWLRMALASR RWTHVVWMGV YRRALITDNN 
ITFVPGLHHQ DILWSTEVMF NATRVRYTEQ SLYKYFLHDN SVSRLQRQGN KNLNYQRHYI 
KITRLLEKLN RDYARRIPIY PEFRQQITWE ALRVCHAVRK EPDILTRQRM IAEIFTSGMY 
RRMMANVRSA KAAYQTLLWS FRLWQWRDKT LSHRRMARKA LNLS