Gene SeHA_C4042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4042
Symbol
ID	6489869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3925497
End bp	3926507
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	35%
IMG OID	642744143
Product	lipopolysaccharide 1,2-glucosyltransferase
Protein accession	YP_002047748
Protein GI	194450584
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1442] Lipopolysaccharide biosynthesis proteins, LPS:glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.436401
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTCAT TTCCTGAGAT AGAAATAGCT GAATATAAAG TTTTTGATGA AAGTAATAAT 
AATGATGATA ACGTATTAAA CATTTCTTAT GGCGTTGATG AAAACTATCT TGATGGTGTG 
GGGGTATCAA TCGCTTCAGT TGTATTAAAC AATAATATCC CGCTCGCTTT TCACATTATT 
TGTGACTCAT ACTCCCCGTG TTTTGTAAAA TATATAGAGC GTTTAGCCGT ACAGCATCAC 
ATAAAAATTT CTCTTTATCT TATTAAAGTA GAAAGCCTTG AGGTATTGCC TCAAACTAAA 
GTATGGTCGA GAGCAATGTA TTTTCGTTTA TTTGCTTTCG ATTATCTCAG CAAGAAGGTA 
AATACCTTAC TTTATTTGGA TGCCGATGTT GTATGCAAAG GATCTTTGCA AGATCTTTTA 
CAGCTTGATC TGACAGAGAA GATCGCTGCG GTCGTAAAAG ATGTTGATTC CATCCAGAAT 
AAGGTAAATG AGAGATTAAG CGCTTTTAAT TTACAAGGTG GTTATTTTAA CTCCGGCGTG 
GTTTTTGTTA ACCTGAAATT ATGGAAAGAG AATGCCTTAA CCAAAAAGGC ATTTTTACTT 
TTGGCAGGTA AAGAGGCTGA CTCTTTTAAA TATCCCGATC AGGATGTTTT GAATATTCTC 
CTACAGGATA AAGTCATTTT TCTACCGCGA CCGTATAATA CTATTTATAC TATTAAAAGT 
GAGTTGAAAG ATAAGTCACA TAAAAAATAT AGCAATATAA TTAATGATAA TACTATTTTA 
ATTCATTATA CGGGCGCTAC AAAACCATGG CATGCCTGGG CAAATTATCC TTCAGTTATC 
TATTATAAAA ATGCACGACT GAACTCGCCC TGGAAAGATT TTCCCGCAAA AGATGCGCGT 
ACCATAGTCG AATTTAAGAA GCGATATAAA CATCTTCTCG TGCAAGGTCA TTATTTTAAA 
GGCCTTCTGG CTGGAAGCGC ATATCTTTAT CGTAAACTTT TCCACAAATA A

Protein sequence

MDSFPEIEIA EYKVFDESNN NDDNVLNISY GVDENYLDGV GVSIASVVLN NNIPLAFHII 
CDSYSPCFVK YIERLAVQHH IKISLYLIKV ESLEVLPQTK VWSRAMYFRL FAFDYLSKKV 
NTLLYLDADV VCKGSLQDLL QLDLTEKIAA VVKDVDSIQN KVNERLSAFN LQGGYFNSGV 
VFVNLKLWKE NALTKKAFLL LAGKEADSFK YPDQDVLNIL LQDKVIFLPR PYNTIYTIKS 
ELKDKSHKKY SNIINDNTIL IHYTGATKPW HAWANYPSVI YYKNARLNSP WKDFPAKDAR 
TIVEFKKRYK HLLVQGHYFK GLLAGSAYLY RKLFHK