Gene EcSMS35_3966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3966
Symbol	rfaG
ID	6145985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4043969
End bp	4045093
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	48%
IMG OID	641618792
Product	lipopolysaccharide core biosynthesis protein RfaG
Protein accession	YP_001745931
Protein GI	170682059
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0237842
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGTTG CTTTTTGTTT ATATAAATAT TTTCCCTTTG GCGGTTTGCA GCGCGATTTT 
ATGCGTATTG CTCAGACAGT TGCCGCCCGA GGTCATCATG TTCGGGTTTA TACCCAGTCG 
TGGGAAGGCG AATGCCCTGA TGTATTTGAA CTGATCAAAG TGCCGGTTAA TTCGCATACC 
AATCACGGGC GCAATGCGGA ATATTTTGCC TGGGTGCAAA AACATTTACG TGAACACCCC 
GTCGATAGAG TCGTTGGATT TAATAAAATG CCGGGGCTGG ACGTTTATTA TGCCGCTGAT 
GTTTGTTATG CCGAGAAAGT AGCGCAGGAG AAAGGCTTTT TCTATCGCCT GACGTCACGT 
TATCGCCATT ATGCCGCCTT TGAGCGGGCA ACCTTCGAAC AGGGCAAGCC GACACAGCTG 
CTGATGCTGA CAGATAAGCA AATCGCCGAT TTCCAGAAAC ATTATCAGAC TGAAGCGGAA 
CGTTTTCATA TTCTGCCACC GGGGATTTAT CCTGATCGTA AATATAGCCA GCAACCAGCG 
AATAGCCGTG AAATCTTCCG TAAGAAGAAT GGAATAACCG AACAACAATA TTTATTGTTG 
CAGGTCGGTT CAGACTTCAC GCGTAAAGGT GTCGATCGTT CCATTGAAGC ACTTGCTTCG 
TTACCGGATT CGCTGCGCCA CAACACATTA CTATATGTTG TTGGGCAGGA TAAACCGCGA 
AAATTTGAGG CGCTGGCAGA AAAACGCGGC GTGCGCAGTA ATGTTCACTT CTTCTCGGGG 
CGCAACGATG TCTCGGAATT AATGGCGGCG GCGGATTTAT TACTTCATCC TGCCTACCAG 
GAAGCGGCGG GAATTGTGTT GCTGGAAGCG ATAACTGCAG GATTACCGGT ACTAACAACA 
GCCGTTTGTG GCTATGCGCA TTATATTGTC GACGCCAATT GCGGCGAGGC TATTGCTGAG 
CCATTCCGCC AGGAAACATT GAATGAGATT TTACGCAAAG CGTTAACGCA ATCTTCATTG 
CGCCAGGCCT GGGCGGAAAA TGCGCGACAT TATGCTGATA CACAAGATTT ATACAGTCTG 
CCAGAGAAAG CGGCGGACAT CATAACGGGT GGTCTGGATG GTTGA

Protein sequence

MIVAFCLYKY FPFGGLQRDF MRIAQTVAAR GHHVRVYTQS WEGECPDVFE LIKVPVNSHT 
NHGRNAEYFA WVQKHLREHP VDRVVGFNKM PGLDVYYAAD VCYAEKVAQE KGFFYRLTSR 
YRHYAAFERA TFEQGKPTQL LMLTDKQIAD FQKHYQTEAE RFHILPPGIY PDRKYSQQPA 
NSREIFRKKN GITEQQYLLL QVGSDFTRKG VDRSIEALAS LPDSLRHNTL LYVVGQDKPR 
KFEALAEKRG VRSNVHFFSG RNDVSELMAA ADLLLHPAYQ EAAGIVLLEA ITAGLPVLTT 
AVCGYAHYIV DANCGEAIAE PFRQETLNEI LRKALTQSSL RQAWAENARH YADTQDLYSL 
PEKAADIITG GLDG