Gene SeHA_C2339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2339
Symbol
ID	6490034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	2243855
End bp	2245072
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	56%
IMG OID	642742528
Product	putative glycosyl transferase
Protein accession	YP_002046163
Protein GI	194448431
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.225754
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	0.701653
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATTC TGCAATTTAA TGTACGGCTG GCGGAAGGCG GCGCGGCGGG AGTGGCGTTG 
GATCTCCATC TGCGGGCGCT GCAAAAAGGG CTGACGTCGC GTTTTGTCTA TGGTTATGGC 
AAAGGCGGAA AAAAAAGCGT CAGCCACCAC CGTTATCCGC AGGTGATAAA ACAGACGCCG 
CGCGGCACGG CAATCGCTAA TATCGCGCTG TTTCGTTTCC TGAATCGCGA TCTGTTTGGC 
AATCTCGACA ATCTTTACCG CACGGTTATC CAGACATCCG GCCCGCTGGT GCTGCATTTT 
CATGTTCTCC ACAGTTACTG GCTAAACCTG GCGGACATCG TGACGTTTTG CGAAAAAGTC 
AAAGCGCAAA AACCAGACGT CACGCTGGTC TGGACGCTGC ACGATCACTG GAGCGTCACC 
GGGCGTTGCG CCTTCACCGA CGGTTGCGAG GGTTGGAAAA GCGGCTGCCA AAAATGCCCG 
ACCCTAAGCA ATTATCCGCC GGTCAGGGTG GATCGGGCGC ACCAGCTTAT TGACGGCAAA 
CGTCAGCGCT TTCGGGACAT GCTGCGGCTG GGCTGCCGGT TTATTTCGCC GAGCCAGCAC 
GTGGCCGAGG CCTTTAACAG CGTTTATGGC GCGGGGCGCT GCCAGATTAT TAACAACGGT 
ATCGATCTGG CGACCGAGGC GATTCTCGCG CAGCTATCAC CTGTGCCGCT GAATCCGGGC 
AAACCGCGGA TCGCCATTGT GGCGCATGAC TTGCGTTATG ACGGCAAAAC TGACCAGCGT 
CTGGTACACG ACATGATGGC GCTGGGCGAA AAAATTGAAC TGCACACCTT CGGTAAATTT 
TCGCCTTTTA CCGGCCAAAA CGTTGTTAAT CACGGTTTTG AAACCGATAA GCGCAAATTA 
ATGAGCGCAC TCAATGAGAT GGATGCGCTG GTCTTTAGCT CGCGGGTCGA TAACTATCCG 
CTGATCTTGT GTGAAGCGCT CTCGATCGGC GTACCGGTGA TCGCCACCCA CAGCGAGGCG 
GCGCAGGAGG TGCTGGCGAA ATCCGGCGGC CAGACCTTTG CCGCTACAGA TGTACTGCGC 
CTGGCGCAGC GGCGTAAGCC AGAGATTGCT CAGGCGGTAT TTGGCGCCAC GCTGGACGCC 
TTTCGTATGC GTAGCCGCGT CGCGTACAGC GGTCAACAGA TGCTGGAGGA GTATGTCTCG 
TTCTATCAGA ATCTGTAG

Protein sequence

MNILQFNVRL AEGGAAGVAL DLHLRALQKG LTSRFVYGYG KGGKKSVSHH RYPQVIKQTP 
RGTAIANIAL FRFLNRDLFG NLDNLYRTVI QTSGPLVLHF HVLHSYWLNL ADIVTFCEKV 
KAQKPDVTLV WTLHDHWSVT GRCAFTDGCE GWKSGCQKCP TLSNYPPVRV DRAHQLIDGK 
RQRFRDMLRL GCRFISPSQH VAEAFNSVYG AGRCQIINNG IDLATEAILA QLSPVPLNPG 
KPRIAIVAHD LRYDGKTDQR LVHDMMALGE KIELHTFGKF SPFTGQNVVN HGFETDKRKL 
MSALNEMDAL VFSSRVDNYP LILCEALSIG VPVIATHSEA AQEVLAKSGG QTFAATDVLR 
LAQRRKPEIA QAVFGATLDA FRMRSRVAYS GQQMLEEYVS FYQNL