Gene SbBS512_E1375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1375
Symbol	prfA
ID	6269304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	1254552
End bp	1255634
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	53%
IMG OID	641725484
Product	peptide chain release factor 1
Protein accession	YP_001879994
Protein GI	187734065
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0216] Protein chain release factor A
TIGRFAM ID	[TIGR00019] peptide chain release factor 1

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000000017097
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCCTT CTATCGTTGC CAAACTGGAA GCCCTGCATG AACGCCATGA AGAAGTTCAG 
GCGTTGCTGG GTGACGCGCA AACTATCGCC GACCAGGAAC GTTTTCGCGC ATTATCACGC 
GAATATGCGC AGTTAAGTGA TGTTTCGCGC TGTTTTACCG ACTGGCAACA GGTTCAGGAA 
GATATCGAAA CCGCACAGAT GATGCTCGAT GATCCTGAAA TGCGTGAGAT GGCGCAGGAT 
GAACTGCGCA AAGCTAAAGA AAAAAGCGAG CAACTGGAAC AGCAATTACA GGTTCTGTTA 
CTGCCAAAAG ATCCTGATGA CGAACGTAAC GCCTTCCTCG AAGTCCGAGC CGGAACCGGC 
GGCGACGAAG CGGCGCTGTT CGCAGGCGAT CTGTTCCGTA TGTACAGCCG TTACGCCGAA 
GCCCGCCGCT GGCGGGTAGA AATCATGAGC GCCAGCGAGG GTGAACATGG TGGTTATAAA 
GAGATCATCG CCAAAATTAG CGGTGATGGT GTGTATGGTC GTCTGAAATT TGAATCTGGC 
GGTCATCGCG TGCAGCGTGT TCCTGCTACG GAATCGCAGG GTCGTATTCA TACTTCTGCT 
TGTACCGTTG CGGTAATGCC AGAACTGCCT GACGCAGAAC TGCCGGACAT CAACCCAGCA 
GATTTACGCA TTGATACTTT CCGCTCGTCA GGGGCGGGTG GTCAGCACGT TAATACCACC 
GATTCGGCAA TTCGTATTAC TCACTTGCCG ACCGGGATTG TTGTTGAATG TCAGGATGAA 
CGTTCACAAC ATAAAAACAA AGCGAAGGCG CTTTCAGTGC TCGGTGCTCG CATCCACGCT 
GCTGAAATGG CAAAACGCCA ACAGGCCGAA GCGTCTACCC GTCGTAACCT GCTGGGGAGT 
GGCGATCGCA GCGACCGTAA CCGTACTTAC AATTTCCCGC AGGGGCGCGT TACCGATCAC 
CGCATCAACC TGACGCTCTA CCGCCTGGAT GAAGTGATGG AAGGTAAGCT GGATATGCTG 
ATTGAACCGA TTATCCAGGA ACATCAGGCC GACCAACTGG CGGCGTTGTC CGAGCAGGAA 
TAA

Protein sequence

MKPSIVAKLE ALHERHEEVQ ALLGDAQTIA DQERFRALSR EYAQLSDVSR CFTDWQQVQE 
DIETAQMMLD DPEMREMAQD ELRKAKEKSE QLEQQLQVLL LPKDPDDERN AFLEVRAGTG 
GDEAALFAGD LFRMYSRYAE ARRWRVEIMS ASEGEHGGYK EIIAKISGDG VYGRLKFESG 
GHRVQRVPAT ESQGRIHTSA CTVAVMPELP DAELPDINPA DLRIDTFRSS GAGGQHVNTT 
DSAIRITHLP TGIVVECQDE RSQHKNKAKA LSVLGARIHA AEMAKRQQAE ASTRRNLLGS 
GDRSDRNRTY NFPQGRVTDH RINLTLYRLD EVMEGKLDML IEPIIQEHQA DQLAALSEQE