Gene EcHS_A4609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4609
Symbol	prfC
ID	5594921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4612729
End bp	4614318
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	54%
IMG OID	640923703
Product	peptide chain release factor 3
Protein accession	YP_001461140
Protein GI	157163822
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG4108] Peptide chain release factor RF-3
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00503] peptide chain release factor 3

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.00121865
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTTGT CTCCTTATTT GCAAGAGGTG GCGAAGCGCC GCACTTTTGC CATTATTTCT 
CACCCGGACG CCGGTAAGAC TACCATCACC GAGAAGGTGC TGCTGTTCGG ACAGGCCATT 
CAGACCGCCG GTACAGTAAA AGGCCGTGGT TCCAACCAGC ACGCTAAGTC GGACTGGATG 
GAGATGGAAA AGCAGCGTGG GATCTCCATT ACTACGTCTG TGATGCAGTT TCCGTATCAC 
GATTGCCTGG TTAACCTGCT CGACACCCCG GGGCACGAAG ACTTCTCGGA AGATACCTAT 
CGTACCCTGA CGGCGGTGGA CTGCTGCCTG ATGGTTATCG ACGCTGCAAA AGGTGTTGAA 
GATCGTACCC GTAAGCTGAT GGAAGTTACC CGTCTGCGCG ACACGCCGAT CCTCACCTTT 
ATGAACAAAC TTGACCGTGA TATCCGCGAC CCGATGGAAC TGCTCGATGA AGTTGAGAAC 
GAGCTGAAAA TCGGCTGCGC ACCGATCACC TGGCCGATTG GCTGCGGCAA GCTGTTTAAA 
GGCGTTTACC ACCTTTATAA AGACGAAACC TATCTCTATC AGAGCGGTAA AGGCCACACG 
ATTCAGGAAG TCCGTATTGT TAAAGGGCTG AATAACCCGG ATCTCGACGC TGCGGTTGGT 
GAAGATCTGG CACAGCAGCT ACGTGACGAA CTGGAACTGG TGAAAGGCGC GTCTAACGAG 
TTCGACAAAG AATTGTTCCT TGCGGGCGAA ATCACTCCGG TATTCTTCGG TACTGCGCTG 
GGTAACTTCG GCGTTGATCA TATGCTGGAT GGCCTGGTGG AGTGGGCTCC TGCGCCGATG 
CCGCGTCAGA CTGATACCCG TACCGTAGAG GCGAGCGAAG ACAAATTTAC CGGCTTCGTA 
TTTAAAATTC AGGCCAACAT GGACCCGAAA CACCGCGACC GCGTGGCGTT TATGCGCGTA 
GTATCCGGTA AATATGAAAA AGGCATGAAG CTGCGCCAGG TGCGTACTGC GAAAGATGTG 
GTTATCTCCG ACGCGCTGAC CTTTATGGCG GGCGACCGTT CGCACGTTGA AGAAGCGTAT 
CCGGGCGATA TCCTCGGCCT GCACAACCAC GGCACTATTC AGATCGGCGA CACCTTTACC 
CAGGGTGAGA TGATGAAGTT CACCGGTATT CCGAACTTCG CACCAGAACT GTTCCGTCGT 
ATCCGCCTGA AAGATCCGCT GAAGCAAAAA CAGCTGCTCA AAGGGCTGGT ACAGCTTTCC 
GAAGAGGGCG CGGTGCAGGT GTTCCGTCCG ATCTCCAACA ACGATTTGAT CGTTGGTGCT 
GTTGGTGTGC TGCAGTTTGA TGTGGTGGTA TCGCGCCTGA AGAGCGAATA CAACGTTGAA 
GCAGTATATG AATCAGTCAA CGTTGCCACT GCCCGCTGGG TAGAATGTGC GGACGCGAAG 
AAATTCGAAG AGTTCAAGCG TAAGAACGAA AGCCAACTGG CGCTTGATGG CGGCGATAAC 
CTCGCTTACA TCGCTACCAG CATGGTCAAC CTGCGCCTGG CGCAGGAACG TTATCCGGAC 
GTTCAGTTCC ACCAGACCCG CGAGCATTAA

Protein sequence

MTLSPYLQEV AKRRTFAIIS HPDAGKTTIT EKVLLFGQAI QTAGTVKGRG SNQHAKSDWM 
EMEKQRGISI TTSVMQFPYH DCLVNLLDTP GHEDFSEDTY RTLTAVDCCL MVIDAAKGVE 
DRTRKLMEVT RLRDTPILTF MNKLDRDIRD PMELLDEVEN ELKIGCAPIT WPIGCGKLFK 
GVYHLYKDET YLYQSGKGHT IQEVRIVKGL NNPDLDAAVG EDLAQQLRDE LELVKGASNE 
FDKELFLAGE ITPVFFGTAL GNFGVDHMLD GLVEWAPAPM PRQTDTRTVE ASEDKFTGFV 
FKIQANMDPK HRDRVAFMRV VSGKYEKGMK LRQVRTAKDV VISDALTFMA GDRSHVEEAY 
PGDILGLHNH GTIQIGDTFT QGEMMKFTGI PNFAPELFRR IRLKDPLKQK QLLKGLVQLS 
EEGAVQVFRP ISNNDLIVGA VGVLQFDVVV SRLKSEYNVE AVYESVNVAT ARWVECADAK 
KFEEFKRKNE SQLALDGGDN LAYIATSMVN LRLAQERYPD VQFHQTREH