Gene EcSMS35_3957 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3957
Symbol	rfaF
ID	6147338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4034924
End bp	4035970
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	54%
IMG OID	641618783
Product	ADP-heptose:LPS heptosyltransferase II
Protein accession	YP_001745922
Protein GI	170683841
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02195] lipopolysaccharide heptosyltransferase II

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000313085
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAC TGGTGATCGG CCCGTCTTGG GTTGGCGACA TGATGATGTC GCAAAGTCTC 
TATCGCACGC TCCAGGCGCG CTATCCCCAG GCGATAATCG ACGTGATGGC ACCGGCATGG 
TGCCGTCCAT TATTATCGCG GATGCCGGAA GTTAACGAAG CGATCCCTAT GCCTCTCGGT 
CACGGAGCGC TGGAAATCGG CGAACGCCGC AAACTGGGTC ATAGTCTGCG TGAAAAGCGC 
TACGACCGCG CCTACGTCTT ACCCAACTCC TTCAAATCCG CATTAGTGCC TTTCTTCGCG 
GGTATTCCTC ATCGCACCGG CTGGCGCGGC GAGATGCGCT ACGGTTTACT TAACGATGTA 
CGCGTGCTCG ATAAAGAAGC CTGGCCGCTA ATGGTGGAAC GCTATGTGGC GCTGGCCTAT 
GACAAAGGCA TTATGCGTAC AGCACAAGAT CTGCCGCAGC CATTGTTATG GCCGCAGTTG 
CAGGTGAGCG AAGGTGAAAA ATCATATACC TGTAATCAAT TTTCGCTCTC ATCAGAACGT 
CCGATGATTG GCTTTTGCCC CGGAGCGGAG TTTGGTCCGG CAAAACGCTG GCCACACTAC 
CACTATGCGG AGCTGGCAAA GCAGCTGATT GATGAAGGTT ATCAGGTGGT TCTGTTTGGC 
TCTGCGAAAG ATCATGAAGC GGGCAATGAG ATTCTTGCCG CTTTAAATAC TGAGCAGCAG 
GCATGGTGCC GGAACCTGGC AGGGGAAACA CAGCTTGATC AAGCGGTTAT CCTGATTGCA 
GCCTGTAAAG CCATTGTCAC TAACGATTCT GGCCTGATGC ACGTTGCGGC GGCGCTCAAT 
CGTCCGCTGG TTGCCTTGTA TGGTCCGAGT AGCCCGGACT TCACACCGCC GCTATCCCAT 
AAAGCACGCG TGATCCGCCT GATTACCGGC TATCACAAAG TGCGTAAAGG TGACGCAGCG 
GAGGGTTATC ACCAGAGCTT GATCGACATT ACTCCCCAGC GCGTACTGGA AGAACTCAAC 
GCGCTATTGT TACAAGAGGA AGCCTGA

Protein sequence

MKILVIGPSW VGDMMMSQSL YRTLQARYPQ AIIDVMAPAW CRPLLSRMPE VNEAIPMPLG 
HGALEIGERR KLGHSLREKR YDRAYVLPNS FKSALVPFFA GIPHRTGWRG EMRYGLLNDV 
RVLDKEAWPL MVERYVALAY DKGIMRTAQD LPQPLLWPQL QVSEGEKSYT CNQFSLSSER 
PMIGFCPGAE FGPAKRWPHY HYAELAKQLI DEGYQVVLFG SAKDHEAGNE ILAALNTEQQ 
AWCRNLAGET QLDQAVILIA ACKAIVTNDS GLMHVAAALN RPLVALYGPS SPDFTPPLSH 
KARVIRLITG YHKVRKGDAA EGYHQSLIDI TPQRVLEELN ALLLQEEA