Gene SeD_A1547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1547
Symbol	prfA
ID	6871944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1494160
End bp	1495242
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	58%
IMG OID	642784699
Product	peptide chain release factor 1
Protein accession	YP_002215369
Protein GI	198242115
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0216] Protein chain release factor A
TIGRFAM ID	[TIGR00019] peptide chain release factor 1

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.891695
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	0.256018
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCTT CTATCGTTGC CAAACTGGAA GCCCTGCACG AACGCCATGA GGAAGTTCAG 
GCGTTGCTGG GCGATGCGGG AATTATTGCC GACCAGGACC GCTTTCGCGC ATTGTCGCGC 
GAATATGCGC AATTAAGCGA CGTTTCTCGC TGTTTTACGG ACTGGCAACA GGTTCAGGAC 
GATATCGAGA CGGCTCAGAT GATGCTCGAC GATCCTGAAA TGCGAGAAAT GGCGCAGGAA 
GAACTGCGCG AAGCGAAAGA AAAAAGCGAA CAACTGGAGC AACAGTTACA GGTACTGCTG 
CTGCCGAAAG ATCCGGACGA TGAACGAAAC GCGTTCCTTG AGGTTCGCGC CGGTACCGGC 
GGCGACGAAG CCGCGCTGTT TGCCGGCGAT CTGTTCCGCA TGTACAGCCG TTATGCCGAA 
GCGCGCCGCT GGCGCGTGGA GATCATGAGC ATGAGCGAAG GCGAGCATGG CGGTTATAAA 
GAGATCATCG CCAAAATCAG CGGCGACGGG GTGTATGGCC GACTGAAGTT TGAGTCCGGC 
GGACACCGCG TACAGCGTGT TCCGGCGACC GAGTCGCAGG GGCGTATCCA TACCTCCGCC 
TGTACCGTCG CCGTGATGCC GGAGCTGCCG GAAGCCGAGC TGCCGGATAT TAACCCGGCG 
GATCTGCGCA TTGATACGTT TCGTTCTTCC GGCGCGGGCG GTCAGCACGT TAACACCACC 
GACTCCGCTA TCCGTATTAC CCACTTGCCG ACCGGCATCG TGGTGGAATG CCAGGACGAG 
CGTTCGCAGC ATAAAAACAA AGCGAAAGCG CTCTCGGTGC TCGGGGCGCG CATTCACGCC 
GCCGAAACGG CAAAACGCCA GCAGGCCGAG GCGTCAACGC GCCGCAACCT GCTTGGCAGC 
GGCGATCGCA GCGATCGTAA CCGGACCTAT AATTTCCCGC AGGGGCGCGT GACCGATCAT 
CGTATTAATC TGACGTTATA TCGCCTTGAT GAAACGATGG AAGGTAAGCT GGATATGCTG 
ATTGAGCCGA TTGTTCAGGA ACACCAGGCT GACCTGTTAG CCGCCTTATC CGAGCAGGAA 
TAA

Protein sequence

MKPSIVAKLE ALHERHEEVQ ALLGDAGIIA DQDRFRALSR EYAQLSDVSR CFTDWQQVQD 
DIETAQMMLD DPEMREMAQE ELREAKEKSE QLEQQLQVLL LPKDPDDERN AFLEVRAGTG 
GDEAALFAGD LFRMYSRYAE ARRWRVEIMS MSEGEHGGYK EIIAKISGDG VYGRLKFESG 
GHRVQRVPAT ESQGRIHTSA CTVAVMPELP EAELPDINPA DLRIDTFRSS GAGGQHVNTT 
DSAIRITHLP TGIVVECQDE RSQHKNKAKA LSVLGARIHA AETAKRQQAE ASTRRNLLGS 
GDRSDRNRTY NFPQGRVTDH RINLTLYRLD ETMEGKLDML IEPIVQEHQA DLLAALSEQE