Gene ECH74115_1464 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1464
Symbol	rluC
ID	6972195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1447632
End bp	1448591
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	52%
IMG OID	643385437
Product	23S rRNA pseudouridylate synthase C
Protein accession	YP_002269931
Protein GI	209400210
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000220754
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.00000000172116
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAACAG AGACTCCATC CGTAAAAATT GTTGCTATCA CCGCCGACGA AGCGGGGCAA 
CGTATCGACA ACTTTTTGCG TACCCAATTG AAAGGCGTAC CAAAAAGTAT GATTTACCGT 
ATTTTGCGTA AAGGCGAAGT GCGGGTGAAC AAAAAACGTA TTAAGCCTGA ATATAAACTC 
GAAGCGGGTG ATGAGGTGCG TATTCCACCG GTTCGCGTTG CTGAGCGGGA AGAAGAGGCG 
GTTTCGCCAC ATCTGCAAAA GGTGGCGGCG CTGGCGGACG TCATCTTATA TGAAGATGAT 
CACATCCTGG TGCTGAATAA ACCTTCCGGT ACGGCGGTAC ATGGCGGCAG TGGTTTAAGC 
TTCGGCGTTA TTGAAGGTTT GCGGGCGTTG CGCCCGGAAG CGCGGTTCCT TGAACTGGTT 
CATCGTCTTG ACCGGGACAC CTCAGGTGTG TTGCTGGTAG CGAAAAAACG CTCGGCGTTG 
CGTTCTCTGC ATGAGCAATT ACGTGAAAAA GGGATGCAAA AAGATTACCT GGCGCTGGTG 
CGCGGTCAGT GGCAGTCGCA TGTGAAGAGC GTTCAGGCGC CGTTATTGAA AAATATTCTG 
CAAAGCGGCG AACGTATCGT GCGTGTGAGT CAGGAAGGCA AACCGTCGGA AACACGCTTT 
AAAGTGGAAG AACGCTATGC ATTTGCCACC CTGGTGCGTT GTAGTCCGGT AACAGGGCGC 
ACTCATCAGA TCCGTGTGCA TACACAGTAT GCAGGTCATC CGATTGCCTT TGACGATCGC 
TACGGTGACC GTGAATTTGA CAGACAGCTC ACTGAAGCAG GCACGGGATT AAATCGTCTG 
TTCCTGCACG CCGCAGCGTT GAAGTTTACC CATCCGGGGA CCGGTGAGGT GATGCGTATC 
GAAGCGCCGA TGGATGATGG TTTGAAGCGT TGTTTGCAAA AGCTGCGTAA CGCGCGCTAA

Protein sequence

MKTETPSVKI VAITADEAGQ RIDNFLRTQL KGVPKSMIYR ILRKGEVRVN KKRIKPEYKL 
EAGDEVRIPP VRVAEREEEA VSPHLQKVAA LADVILYEDD HILVLNKPSG TAVHGGSGLS 
FGVIEGLRAL RPEARFLELV HRLDRDTSGV LLVAKKRSAL RSLHEQLREK GMQKDYLALV 
RGQWQSHVKS VQAPLLKNIL QSGERIVRVS QEGKPSETRF KVEERYAFAT LVRCSPVTGR 
THQIRVHTQY AGHPIAFDDR YGDREFDRQL TEAGTGLNRL FLHAAALKFT HPGTGEVMRI 
EAPMDDGLKR CLQKLRNAR