Gene ECH74115_5002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5002
Symbol	rfaQ
ID	6971115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4654032
End bp	4655090
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	47%
IMG OID	643388683
Product	lipopolysaccharide core biosynthesis protein
Protein accession	YP_002273110
Protein GI	209396360
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02201] lipopolysaccharide heptosyltransferase III, putative

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0026899
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	72
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATAAGC CATTTCGAAG AATTTTGCTC ATTAAGATGC GTTTTCATGG GGATATGTTA 
TTAACTACTC CCGTCATTAG TTCGCTGAAA AAAAATTACC CTGACGCAAA AATCGATGTG 
CTGCTTTATC AGGACACCAT CCCGATCCTG TCTGAAAATC CAGAGATTAA CGCGCTCTAC 
GGCATAAAAA ATAAAAAAGC AAAAGCCTCA GAAAAAATTG CCAACTTTTT TCATCTCATC 
AAGGTATTAC GTGCCAATAA GTATGACCTT ATCGTCAATC TTACCGATCA ATGGATGGTT 
GCTATACTGG TTCGCTTATT AAATGCCCGT GTGAAAATTT CCCAGGATTA TCATCATCGG 
CAGTCTGCTT TTTGGCGTAA AAGTTTCACC CATTTGGTGC CGTTGCAGGG TGGAAATGTG 
GTGGAAAGTA ACTTATCCGT GCTGACACCA TTGGGACTTG ATTCGTTGGT GAAGCAGACA 
ACCATGAGTT ACCCGCCTGC AAGCTGGAAA CGTATGCGTC GCGAACTTGA TCACGCTGGT 
GTTGGACAAA ATTATGTGGT TATCCAACCT ACGGCGCGGC AAATCTTCAA ATGCTGGGAC 
AACGCCAAGT TTTCCGCTGT GATTGATGCC TTACATGCTC GTGGTTATGA AGTCGTTCTG 
ACGTCCGGCC CAGATAAAGA CGATCTGGCC TGCGTCAATG AAATTGCGCA AGGATGCCAG 
ACGCCACCAG TAACGGCGCT GGCTGGAAAG GTGACCTTCC CGGAACTTGG TGCGTTAATC 
GATCATGCGC AGCTGTTTAT TGGCGTTGAT TCCGCACCGG CGCATATTGC CGCTGCAGTT 
AATACGCCGC TGATATCGCT GTTTGGTGCG ACAGACCATA TTTTCTGGCG TCCTTGGTCA 
AATAACATGA TTCAATTCTG GGCGGGAGAT TACCGGGAAA TGCCAACGCG CGATCAGCGT 
GACCGAAATG AGATGTATCT TTCGGTTATT CCGGCGGCAG ATGTCATTGC TGCTGTCGAT 
AAATTACTGC CCTCCTCCAC GACAGGTACG TCGTTATGA

Protein sequence

MDKPFRRILL IKMRFHGDML LTTPVISSLK KNYPDAKIDV LLYQDTIPIL SENPEINALY 
GIKNKKAKAS EKIANFFHLI KVLRANKYDL IVNLTDQWMV AILVRLLNAR VKISQDYHHR 
QSAFWRKSFT HLVPLQGGNV VESNLSVLTP LGLDSLVKQT TMSYPPASWK RMRRELDHAG 
VGQNYVVIQP TARQIFKCWD NAKFSAVIDA LHARGYEVVL TSGPDKDDLA CVNEIAQGCQ 
TPPVTALAGK VTFPELGALI DHAQLFIGVD SAPAHIAAAV NTPLISLFGA TDHIFWRPWS 
NNMIQFWAGD YREMPTRDQR DRNEMYLSVI PAADVIAAVD KLLPSSTTGT SL