Gene EcE24377A_4133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4133
Symbol	rfaQ
ID	5590050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4123005
End bp	4124027
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	47%
IMG OID	640927752
Product	lipopolysaccharide core biosynthesis protein
Protein accession	YP_001465112
Protein GI	157157104
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02201] lipopolysaccharide heptosyltransferase III, putative

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000187228
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTTTC ATGGGGATAT GTTATTAACT ACTCCCGTCA TTAGTTCGCT GAAAAAAAAT 
TACCCTGACG CAAAAATCGA TGTGCTGCTT TATCAGGACA CCATCCCGAT CCTGTCTGAA 
AATCCAGAGA TTAACGCGCT CTACGGCATA AAAAATAAAA AAGCAAAAGC CTCAGAAAAA 
ATTGCCAACT TTTTTCATCT CATCAAGGTA TTACGTGCCA ATAAGTATGA CCTTATCGTC 
AATCTTACCG ATCAATGGAT GGTTGCTATA CTGGTTCGCT TATTAAATGC TCGTGTGAAA 
ATTTCCCAGG ATTATCATCA TCGGCAGTCT GCTTTTTGGC GTAAAAGTTT CACCCATTTG 
GTGCCGTTGC AGGGTGGAAA TGTGGTGGAA AGTAACTTAT CCGTGCTGAC ACCATTGGGA 
CTTGATTCGT TGGTGAAGCA GACAACCATG AGTTACCCGC CTGCAAGCTG GAAACGTATG 
CGTCGCGAAC TTGATCACGC TGGTGTTGGA CAAAATTATG TGGTTATCCA ACCTACGGCG 
CGGCAAATCT TCAAATGCTG GGACAACGCC AAGTTTTCCG CTGTGATTGA TGCCTTACAT 
GCTCGTGGTT ATGAAGTCGT TCTGACGTCC GGCCCAGATA AAGACGATCT GGCCTGCGTC 
AATGAAATTG CGCAGGGATG CCAGACGCCA CCAGTAACGG CGCTGGCTGG AAAGGTGACC 
TTCCCGGAAC TTGGTGCGTT AATCGATCAT GCGCAGCTGT TTATTGGCGT TGATTCCGCA 
CCGGCGCATA TTGCCGCTGC AGTTAATACG CCGCTGATAT CGCTGTTTGG CGCAACAGAT 
CATATTTTCT GGCGTCCCTG GTCAAATAAC ATGATTCAAT TCTGGGCGGG AGATTACCGG 
GAAATGCCAA CGCGCGATCA GCGTGACCGA AATGAGATGT ATCTTTCGGT TATTCCGGCG 
GCAGATGTCA TTGCTGCTGT CGATAAATTA CTGCCCTCCT CCACGACAGG TACGTCGTTA 
TGA

Protein sequence

MRFHGDMLLT TPVISSLKKN YPDAKIDVLL YQDTIPILSE NPEINALYGI KNKKAKASEK 
IANFFHLIKV LRANKYDLIV NLTDQWMVAI LVRLLNARVK ISQDYHHRQS AFWRKSFTHL 
VPLQGGNVVE SNLSVLTPLG LDSLVKQTTM SYPPASWKRM RRELDHAGVG QNYVVIQPTA 
RQIFKCWDNA KFSAVIDALH ARGYEVVLTS GPDKDDLACV NEIAQGCQTP PVTALAGKVT 
FPELGALIDH AQLFIGVDSA PAHIAAAVNT PLISLFGATD HIFWRPWSNN MIQFWAGDYR 
EMPTRDQRDR NEMYLSVIPA ADVIAAVDKL LPSSTTGTSL