Gene SNSL254_A3991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3991
Symbol	rfaF
ID	6482756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3878689
End bp	3879735
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	59%
IMG OID	642739251
Product	ADP-heptose:LPS heptosyltransferase II
Protein accession	YP_002042961
Protein GI	194443073
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02195] lipopolysaccharide heptosyltransferase II

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTT TGGTCATTGG CCCGTCCTGG GTGGGCGACA TGATGATGTC GCAAAGTCTC 
TATCGCACGC TTAAAGCGCG CTATCCCCAG GCGATAATCG ACGTGATGGC GCCAGCCTGG 
TGCCGTCCGT TGTTATCGCG TATGCCGGAA GTTAACGAGG CGATACCCAT GCCGTTGGGC 
CACGGCGCGC TGGAAATCGG CGAGCGCCGC AGATTGGGCC ATAGCCTGCG AGAGAGGCGC 
TACGATCGCG CCTGGGTGCT GCCAAATTCG TTTAAATCAG CGCTGATTCC TTTCTTTGCC 
AATATCCCGC ACCGTACCGG CTGGCGCGGC GAAATGCGCT ATGGCCTGCT GAACGATGCG 
CGCGTCCTTG ATAAAGACGC CTGGCCGCTG ATGGTGGAGC GCTACGTGGC GCTGGCCTAT 
GACAAGGGCG TGATGCGCAC GGCGAAAGAT CTGCCGCAGC CGCTGCTCTG GCCGCAGCTC 
CAGGTTAGCG AAGGTGAAAA GTCGCTGATG TGCAGCGACT TTTCGCTATC TTCTGAACGT 
CCTCTGATCG GCTTTTGCCC CGGCGCAGAA TTTGGCCCGG CAAAACGTTG GCCGCACTAT 
CACTACGCCG AACTGGCAAA GCAGCTCATT AACGAAGGGT ATCAGGTCGT ACTGTTTGGC 
TCGGCAAAAG ACCATGAAGC CGGAAATGAG ATCCTGGCGG CGCTGAATAG CGAGCAGCAG 
GCATGGTGTC GCAACCTGGC GGGGGAAACC CAGCTGGAAC AGGCCGTCAT TCTGATAGCC 
GCCTGTAAAG CCATCGTCAC TAACGATTCC GGACTGATGC ACGTCGCGGC GGCGCTCGAC 
CGCCCGCTGG TCGCGTTGTA TGGCCCAAGT AGCCCGGATT TCACGCCGCC GCTGTCTCAT 
AAGGCCCGGG TGATTCGTCT CATTACGGGT TACCACAAAG TGCGTAAAGG CGATACGGCG 
CAAGGCTATC ACCAGAGCCT GATCGATATC ACGCCGCAGC GGGTTCTGGA AGAGCTTCAT 
TCGCTGTTGT CGGAAGAGGG CGTTTAA

Protein sequence

MKILVIGPSW VGDMMMSQSL YRTLKARYPQ AIIDVMAPAW CRPLLSRMPE VNEAIPMPLG 
HGALEIGERR RLGHSLRERR YDRAWVLPNS FKSALIPFFA NIPHRTGWRG EMRYGLLNDA 
RVLDKDAWPL MVERYVALAY DKGVMRTAKD LPQPLLWPQL QVSEGEKSLM CSDFSLSSER 
PLIGFCPGAE FGPAKRWPHY HYAELAKQLI NEGYQVVLFG SAKDHEAGNE ILAALNSEQQ 
AWCRNLAGET QLEQAVILIA ACKAIVTNDS GLMHVAAALD RPLVALYGPS SPDFTPPLSH 
KARVIRLITG YHKVRKGDTA QGYHQSLIDI TPQRVLEELH SLLSEEGV