Gene SeHA_C4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4037
Symbol	rfaC
ID	6488596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3920307
End bp	3921260
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	55%
IMG OID	642744138
Product	ADP-heptose:LPS heptosyl transferase I
Protein accession	YP_002047743
Protein GI	194450269
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02193] lipopolysaccharide heptosyltransferase I

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGTTT TGATCGTTAA AACATCATCG ATGGGCGACG TATTACATAC CCTGCCTGCG 
CTTACCGACG CGCAACAGGC GATTCCGGGG ATTCAATTTG ATTGGGCTGT CGAAGAAGGG 
TTTGCACAAA TTCCGTCCTG GCACAGTGCT GTCGATCGCG TGATTCCCGT CGCTATTCGC 
CGTTGGCGCA AGGCCTGGTT TTCCGCGCCC ATCAAAGCGG AACGCACAGC CTTTCGTCGG 
GCGGTATGCG CAAACCAATA CGACGCTGTG ATTGATGCGC AGGGGCTGGT AAAAAGCGCG 
GCGCTGGTGA CGCGTCTGGC GCATGGGATA AAGCACGGTA TGGACTGGAG TACCGCCCGC 
GAACCGCTGG CCAGCCTGTT CTATAACCGT AAACACCATA TCGCAAAGCA ACAACATGCG 
GTTGAACGGA CGCGCGAGCT GTTCGCCAAA AGCCTGGGAT ACGATAAACC GCAGTCGCAG 
GGCGATTATG CCATCGCAAA ACATTTTCTG CATTGCCAGC AGGCGGTTAG CGATCCGTAT 
GCGGTGTTTT TACATGCCAC GACCCGCGAT GATAAACACT GGCCGGAAGC AAACTGGCGC 
GAGCTTATCG GCCTGGTGGG CAACACCGGA TTACGGATAA AGCTTCCCTG GGGCGCGCCT 
CATGAGGAGG CCCGGGCTAA ACGACTGGCC GAAGGCTTTG ACTATGTGGA TGTGTTACCG 
CGCATGAGCC TGGAGGAGGT CGCCAGAGTG CTGGCTGGCG CAAAATTTGT CGTATCGGTT 
GATACCGGCC TGAGCCATCT CACCGCCGCG CTCGACAGAC CGAATATTAC GCTATATGGC 
CCAACGGACC CTGGGTTAAT TGGAGGTTAT GGGAAGAACC AAATGGCATG CTGCTCACCA 
GAACAGAACC TGGCGAATTT AGATGCCACA AGCGTATTTG GAAAGATTCA TTAA

Protein sequence

MRVLIVKTSS MGDVLHTLPA LTDAQQAIPG IQFDWAVEEG FAQIPSWHSA VDRVIPVAIR 
RWRKAWFSAP IKAERTAFRR AVCANQYDAV IDAQGLVKSA ALVTRLAHGI KHGMDWSTAR 
EPLASLFYNR KHHIAKQQHA VERTRELFAK SLGYDKPQSQ GDYAIAKHFL HCQQAVSDPY 
AVFLHATTRD DKHWPEANWR ELIGLVGNTG LRIKLPWGAP HEEARAKRLA EGFDYVDVLP 
RMSLEEVARV LAGAKFVVSV DTGLSHLTAA LDRPNITLYG PTDPGLIGGY GKNQMACCSP 
EQNLANLDAT SVFGKIH