Gene EcHS_A3840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3840
Symbol	rfaG
ID	5593298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3835529
End bp	3836653
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	48%
IMG OID	640922952
Product	lipopolysaccharide core biosynthesis protein RfaG
Protein accession	YP_001460430
Protein GI	157163112
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.000000503275
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGTTG CTTTTTGTTT ATATAAATAT TTTCCCTTTG GCGGTTTGCA GCGCGATTTT 
ATGCGTATTG CTCAGACAGT CACCGCCCGA GGTCATCATG TTCGGGTTTA TACCCAGTCG 
TGGGAAGGCG AATGCCCTGA TGTATTTGAA CTGATCAAAG TGCCGGTTAA ATCGCATACC 
AATCACGGGC GCAATGCGGA GTATTTTACC TGGGTGCAAA AACATTTACG CGAACATCCC 
GTCGATAAAG TCGTTGGATT CAACAAAATG CCGGGGCTGG ACGTTTATTA TGCCGCTGAT 
GTTTGTTATG CCGAGAAAGT AGCGCAGGAG AAAGGCTTTT TCTATCGCCT GACGTCACGT 
TATCGCCATT ATGCCGCCTT TGAGCGGGCA ACCTTCGAAC AGGGCAAGCC GACACAGCTG 
CTGATGCTGA CAGATAAGCA AATCGCCGAT TTCCAGAAAC ATTATCAGAC TGAAGCGGAG 
CGTTTTCATA TTCTGCCACC GGGGATTTAT CCTGATCGTA AATATAGCCA GCAGCCAGCC 
AATAGCCGTG AAATCTTCCG TAAGAAGAAT GGAATAACCG AACAACAATA TTTATTGTTG 
CAGGTCGGTT CAGACTTCAC GCGTAAAGGT GTCGATCGTT CCATTGAAGC ACTTGCTTCT 
TTACCGGATT CGCTGCGCCA CAACACATTG CTATATGTTG TTGGGCAGGA TAAACCGCGA 
AAATTTGAGG CGCTGGCAGA AAAACGCGGC GTGCGCAGTA ATGTTCACTT CTTCTCGGGG 
CGCAATGATG TCTCGGAATT AATGGCGGCG GCGGATTTAT TACTGCATCC TGCCTACCAG 
GAAGCGGCGG GAATTGTGCT GCTGGAAGCG ATTACTGCAG GATTACCGGT ACTAACAACA 
GCCGTTTGTG GCTATGCGCC TTATATTGTC GAGGCCAATT GCGGCGAGGC TATTGCTGAG 
CCATTCCGCC AGGAAACATT GAATGAGATT TTACGCAAAG CGTTAACGCA ATCTTCATTG 
CGCCAGGCCT GGGCGGAAAA TGCGCGACAT TATGCTGATA CACAAGATTT ATACAGTCTG 
CCAGAGAAAG CGGCGGATAT CATAACGGGT GGTCTGGATG GTTGA

Protein sequence

MIVAFCLYKY FPFGGLQRDF MRIAQTVTAR GHHVRVYTQS WEGECPDVFE LIKVPVKSHT 
NHGRNAEYFT WVQKHLREHP VDKVVGFNKM PGLDVYYAAD VCYAEKVAQE KGFFYRLTSR 
YRHYAAFERA TFEQGKPTQL LMLTDKQIAD FQKHYQTEAE RFHILPPGIY PDRKYSQQPA 
NSREIFRKKN GITEQQYLLL QVGSDFTRKG VDRSIEALAS LPDSLRHNTL LYVVGQDKPR 
KFEALAEKRG VRSNVHFFSG RNDVSELMAA ADLLLHPAYQ EAAGIVLLEA ITAGLPVLTT 
AVCGYAPYIV EANCGEAIAE PFRQETLNEI LRKALTQSSL RQAWAENARH YADTQDLYSL 
PEKAADIITG GLDG