Gene SeHA_C1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1971
Symbol	prfA
ID	6490858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	1921139
End bp	1922221
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	58%
IMG OID	642742176
Product	peptide chain release factor 1
Protein accession	YP_002045819
Protein GI	194448370
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0216] Protein chain release factor A
TIGRFAM ID	[TIGR00019] peptide chain release factor 1

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00228451
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCTT CTATCGTTGC CAAACTGGAA GCCCTGCACG AACGCCATGA GGAAGTTCAG 
GCGTTGCTGG GCGATGCGGG AATTATCGCC GACCAGGACC GCTTTCGCGC ATTGTCGCGC 
GAATATGCGC AATTAAGCGA CGTTTCTCGC TGTTTTACGG ACTGGCAACA GGTTCAGGAC 
GATATCGAGA CGGCTCAGAT GATGCTCGAC GATCCTGAAA TGCGGGAAAT GGCGCAGGAA 
GAACTGCGCG AAGCGAAAGA AAAAAGCGAA CAACTGGAGC AACAGTTACA GGTACTGCTG 
CTGCCGAAAG ATCCGGACGA TGAACGAAAC GCGTTCCTTG AGGTTCGCGC CGGCACTGGC 
GGCGACGAAG CCGCGCTGTT TGCCGGCGAT CTGTTCCGCA TGTACAGCCG TTATGCCGAA 
GCGCGCCGCT GGCGCGTGGA GATCATGAGC ATGAGCGAAG GCGAGCATGG CGGTTATAAA 
GAGATCATCG CCAAAATCAG CGGCGACGGC GTGTATGGCC GACTGAAATT TGAGTCCGGC 
GGACACCGCG TACAGCGTGT TCCGGCGACC GAGTCGCAGG GGCGTATCCA TACCTCCGCC 
TGTACCGTCG CCGTGATGCC GGAGCTGCCG GAAGCCGAGC TGCCGGATAT TAACCCGGCG 
GATCTGCGCA TTGATACGTT TCGTTCTTCC GGCGCGGGCG GTCAGCACGT TAACACCACC 
GACTCCGCTA TCCGAATTAC CCACTTGCCG ACCGGCATCG TGGTGGAATG CCAGGACGAG 
CGTTCGCAGC ATAAAAACAA AGCGAAAGCG CTCTCGGTGC TCGGGGCGCG CATTCACGCC 
GCCGAAACGG CAAAACGCCA GCAGGCCGAG GCGTCAACGC GCCGCAACCT GCTTGGCAGC 
GGCGATCGCA GCGATCGTAA CCGGACCTAT AATTTCCCGC AGGGGCGCGT GACCGATCAT 
CGTATTAATC TGACGTTATA TCGCCTTGAT GAAACGATGG AAGGTAAGCT GGATATGCTG 
ATTGAGCCGA TTGTTCAGGA ACACCAGGCT GACCTGTTAG CCGCCTTATC CGAGCAGGAA 
TAA

Protein sequence

MKPSIVAKLE ALHERHEEVQ ALLGDAGIIA DQDRFRALSR EYAQLSDVSR CFTDWQQVQD 
DIETAQMMLD DPEMREMAQE ELREAKEKSE QLEQQLQVLL LPKDPDDERN AFLEVRAGTG 
GDEAALFAGD LFRMYSRYAE ARRWRVEIMS MSEGEHGGYK EIIAKISGDG VYGRLKFESG 
GHRVQRVPAT ESQGRIHTSA CTVAVMPELP EAELPDINPA DLRIDTFRSS GAGGQHVNTT 
DSAIRITHLP TGIVVECQDE RSQHKNKAKA LSVLGARIHA AETAKRQQAE ASTRRNLLGS 
GDRSDRNRTY NFPQGRVTDH RINLTLYRLD ETMEGKLDML IEPIVQEHQA DLLAALSEQE