Gene EcSMS35_1931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1931
Symbol	prfA
ID	6147402
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1951001
End bp	1952083
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	53%
IMG OID	641616807
Product	peptide chain release factor 1
Protein accession	YP_001743983
Protein GI	170682630
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0216] Protein chain release factor A
TIGRFAM ID	[TIGR00019] peptide chain release factor 1

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000608431
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.0690317
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCTT CTATCGTTGC CAAACTGGAA GCCCTGCATG AACGCCATGA AGAAGTTCAG 
GCGTTGCTGG GTGACGCGCA AACTATCGCC GACCAGGAAC GTTTTCGCGC ATTATCACGC 
GAATATGCGC AGTTAAGTGA TGTTTCGCGC TGTTTTACCG ACTGGCAACA GGTTCAGGAA 
GATATCGAAA CCGCACAGAT GATGCTCGAC GATCCTGAAA TGCGTGAGAT GGCGCAGGAT 
GAACTGCGCG AAGCTAAAGA AAAAAGCGAG CAACTGGAAC AGCAATTACA GGTTCTGTTA 
CTACCAAAAG ATCCTGATGA CGAACGTAAC GCCTTCCTCG AAGTCCGTGC CGGAACCGGC 
GGCGACGAAG CGGCGCTGTT CGCTGGCGAT CTGTTCCGTA TGTACAGCCG TTACGCCGAA 
GCCCGCCGCT GGCGTGTAGA AATCATGAGC GCCAGCGAGG GTGAACATGG TGGTTATAAA 
GAGATCATCG CCAAAATTAG CGGTGATGGT GTATATGGTC GTTTGAAATT CGAATCTGGC 
GGTCATCGCG TGCAGCGTGT TCCTGCTACG GAATCGCAGG GTCGTATTCA TACTTCTGCT 
TGTACCGTTG CGGTAATGCC AGAACTGCCT GACGCAGAAC TGCCGGACAT CAACCCAGCA 
GATTTGCGCA TTGATACTTT CCGCTCGTCA GGGGCGGGGG GGCAGCACGT TAACACCACC 
GATTCGGCAA TTCGTATTAC TCACTTGCCG ACCGGAATTG TTGTTGAATG TCAGGACGAA 
CGTTCACAAC ATAAAAACAA AGCTAAAGCA CTTTCTGTAC TCGGTGCTCG TATCCACGCT 
GCTGAAATGG CAAAACGGCA ACAGGCCGAA GCGTCTACCC GTCGTAACCT GCTGGGGAGT 
GGCGATCGCA GCGACCGTAA CCGTACTTAC AACTTCCCGC AGGGGCGCGT TACCGATCAC 
CGCATCAACC TGACGCTCTA CCGCCTGGAT GAAGTGATGG AAGGTAAGCT GGATATGCTA 
ATTGAACCGA TTATCCAGGA ACATCAGGCC GACCAACTGG CGGCGTTGTC CGAGCAGGAA 
TAA

Protein sequence

MKPSIVAKLE ALHERHEEVQ ALLGDAQTIA DQERFRALSR EYAQLSDVSR CFTDWQQVQE 
DIETAQMMLD DPEMREMAQD ELREAKEKSE QLEQQLQVLL LPKDPDDERN AFLEVRAGTG 
GDEAALFAGD LFRMYSRYAE ARRWRVEIMS ASEGEHGGYK EIIAKISGDG VYGRLKFESG 
GHRVQRVPAT ESQGRIHTSA CTVAVMPELP DAELPDINPA DLRIDTFRSS GAGGQHVNTT 
DSAIRITHLP TGIVVECQDE RSQHKNKAKA LSVLGARIHA AEMAKRQQAE ASTRRNLLGS 
GDRSDRNRTY NFPQGRVTDH RINLTLYRLD EVMEGKLDML IEPIIQEHQA DQLAALSEQE