Gene EcSMS35_4922 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4922
Symbol	prfC
ID	6147399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	5037780
End bp	5039369
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	54%
IMG OID	641619725
Product	peptide chain release factor 3
Protein accession	YP_001746829
Protein GI	170683721
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG4108] Peptide chain release factor RF-3
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00503] peptide chain release factor 3

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.55632
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTTGT CTCCTTATTT GCAAGAGGTG GCGAAGCGCC GCACTTTTGC CATTATTTCT 
CACCCGGACG CCGGTAAAAC TACCATCACC GAGAAGGTGC TGCTGTTCGG ACAGGCCATT 
CAGACCGCCG GTACAGTAAA AGGCCGTGGT TCCAACCAGC ACGCTAAGTC GGACTGGATG 
GAGATGGAAA AGCAGCGTGG GATCTCCATT ACTACTTCTG TGATGCAGTT TCCGTATCAC 
GATTGCCTGG TTAACCTGCT CGACACCCCG GGGCACGAAG ACTTCTCGGA AGATACCTAT 
CGTACCCTGA CGGCGGTGGA CTGCTGCCTG ATGGTTATCG ACGCTGCAAA AGGTGTTGAA 
GATCGTACCC GTAAGCTGAT GGAAGTTACC CGTCTGCGCG ATACGCCGAT CCTCACCTTT 
ATGAACAAAC TTGACCGTGA TATCCGCGAC CCGATGGAAC TGCTCGATGA AGTTGAGAAC 
GAGCTGAAAA TCGGCTGCGC ACCGATCACC TGGCCGATTG GCTGCGGCAA GCTGTTTAAA 
GGCGTTTACC ACCTTTATAA AGATGAAACC TATCTCTATC AGAGCGGTAA AGGCCACACC 
ATTCAGGAAG TCCGCATTGT TAAAGGGCTG AATAACCCGG ATCTCGACGC TGCGGTTGGT 
GAAGATCTGG CACAGCAACT GCGTGACGAA CTGGAACTGG TGAAAGGCGC GTCTAACGAG 
TTCGACAAAG AATTGTTCCT TGCGGGCGAA ATTACTCCAG TGTTCTTTGG TACTGCGCTG 
GGTAACTTCG GCGTTGATCA TATGCTGGAT GGCCTGGTGG AGTGGGCCCC AGCGCCGATG 
CCGCGTCAGA CTGATACCCG TACCGTAGAG GCGAGCGAAG ATAAATTTAC CGGCTTCGTA 
TTTAAAATTC AGGCCAACAT GGACCCGAAA CACCGCGACC GCGTGGCGTT TATGCGTGTG 
GTGTCCGGTA AATATGAAAA AGGCATGAAG CTGCGCCAGG TGCGTACTGC GAAAGATGTG 
GTGATCTCCG ACGCGCTGAC CTTTATGGCG GGTGACCGTT CGCACGTTGA AGAAGCGTAT 
CCTGGCGATA TCCTTGGTCT GCACAACCAC GGCACCATTC AGATCGGCGA CACCTTTACC 
CAGGGTGAGA TGATGAAGTT CACCGGTATT CCGAACTTCG CGCCAGAACT GTTCCGTCGT 
ATCCGCCTGA AAGATCCGCT GAAGCAAAAA CAGCTGCTCA AAGGGCTGGT ACAGCTTTCC 
GAAGAGGGCG CGGTGCAGGT GTTCCGTCCG ATCTCCAACA ACGACCTGAT CGTTGGTGCA 
GTTGGTGTGC TGCAGTTTGA TGTGGTGGTA GCGCGCCTGA AGAGCGAATA CAACGTTGAA 
GCAGTGTATG AGTCAGTCAA CGTTGCCACT GCCCGCTGGG TAGAATGTGC GGACGCGAAG 
AAATTCGAAG AGTTCAAGCG TAAGAACGAA AGCCAACTGG CGCTTGATGG CGGCGATAAC 
CTCGCTTACA TCGCTACCAG CATGGTCAAC CTGCGCCTGG CGCAGGAACG TTATCCGGAC 
GTTCAGTTCC ACCAGACCCG CGAGCATTAA

Protein sequence

MTLSPYLQEV AKRRTFAIIS HPDAGKTTIT EKVLLFGQAI QTAGTVKGRG SNQHAKSDWM 
EMEKQRGISI TTSVMQFPYH DCLVNLLDTP GHEDFSEDTY RTLTAVDCCL MVIDAAKGVE 
DRTRKLMEVT RLRDTPILTF MNKLDRDIRD PMELLDEVEN ELKIGCAPIT WPIGCGKLFK 
GVYHLYKDET YLYQSGKGHT IQEVRIVKGL NNPDLDAAVG EDLAQQLRDE LELVKGASNE 
FDKELFLAGE ITPVFFGTAL GNFGVDHMLD GLVEWAPAPM PRQTDTRTVE ASEDKFTGFV 
FKIQANMDPK HRDRVAFMRV VSGKYEKGMK LRQVRTAKDV VISDALTFMA GDRSHVEEAY 
PGDILGLHNH GTIQIGDTFT QGEMMKFTGI PNFAPELFRR IRLKDPLKQK QLLKGLVQLS 
EEGAVQVFRP ISNNDLIVGA VGVLQFDVVV ARLKSEYNVE AVYESVNVAT ARWVECADAK 
KFEEFKRKNE SQLALDGGDN LAYIATSMVN LRLAQERYPD VQFHQTREH