Gene SeHA_C4036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4036
Symbol	rfaF
ID	6489663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3919261
End bp	3920307
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	58%
IMG OID	642744137
Product	ADP-heptose:LPS heptosyltransferase II
Protein accession	YP_002047742
Protein GI	194447352
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02195] lipopolysaccharide heptosyltransferase II

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTT TGGTCATTGG CCCGTCCTGG GTGGGCGACA TGATGATGTC GCAAAGTCTC 
TATCGCACGC TTAAAGCACG CTATCCCCAG GCGATAATCG ACGTGATGGC GCCAGCCTGG 
TGTCGTCCGT TATTATCGCG TATGCCGGAA GTTAACGAGG CGATACCCAT GCCGTTGGGC 
CACGGCGCGC TGGAAATCGG CGAGCGCCGC AGATTGGGCC ATAGCCTGCG AGAGAAGCGC 
TACGATCGCG CCTGGGTGTT GCCAAATTCG TTTAAATCGG CGCTGATTCC TTTCTTTGCC 
AATATCCCGC ACCGTACCGG CTGGCGCGGC GAAATGCGCT ATGGCCTGCT GAACGATGCG 
CGCGTCCTTG ATAAAGACGC CTGGCCACTG ATGGTGGAGC GCTACGTGGC GCTGGCTTAT 
GACAAGGGCG TGATGCGCAC GGCGAAAGAT CTGCCCCAGC CGCTACTCTG GCCACAGCTC 
CAGGTTAGCG AGGGTGAAAA GTCGCTGATG TGCAGCGACT TTTCACTATC TTCTGAACGT 
CCTCTGATCG GCTTTTGCCC CGGCGCAGAA TTTGGCCCGG CAAAACGTTG GCCGCACTAT 
CACTACGCCG AACTGGCAAA GCAGCTCATT AACGAAGGGT ATCAGGTCGT GCTGTTTGGC 
TCGGCAAAAG ACCATGAAGC CGGAAATGAG ATCCTGGCGG CGCTGAATAG CGAGCAGCAG 
GCATGGTGTC GCAACCTGGC GGGGGAAACC CAGCTGGAAC AGGCCGTCAT TCTGATAGCC 
GCCTGTAAAG CCATCGTCAC TAACGATTCC GGGCTGATGC ACGTCGCGGC GGCGCTCGAC 
CGCCCGCTGG TCGCCTTGTA TGGCCCAAGT AGCCCGGATT TCACGCCGCC GCTGTCTCAT 
AAGGCCCGGG TGATTCGTCT CATTACGGGT TATCACAAAG TGCGTAAAGG TGATACGGCG 
CAAGGCTATC ACCAGAGCCT GATCGATATC ACGCCGCAGC GGGTTCTGGA AGAGCTTCAT 
TCGCTGTTGT CGGAAGAGGG CGTTTAA

Protein sequence

MKILVIGPSW VGDMMMSQSL YRTLKARYPQ AIIDVMAPAW CRPLLSRMPE VNEAIPMPLG 
HGALEIGERR RLGHSLREKR YDRAWVLPNS FKSALIPFFA NIPHRTGWRG EMRYGLLNDA 
RVLDKDAWPL MVERYVALAY DKGVMRTAKD LPQPLLWPQL QVSEGEKSLM CSDFSLSSER 
PLIGFCPGAE FGPAKRWPHY HYAELAKQLI NEGYQVVLFG SAKDHEAGNE ILAALNSEQQ 
AWCRNLAGET QLEQAVILIA ACKAIVTNDS GLMHVAAALD RPLVALYGPS SPDFTPPLSH 
KARVIRLITG YHKVRKGDTA QGYHQSLIDI TPQRVLEELH SLLSEEGV