Gene ECH_0597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0597
Symbol	prfA
ID	3927422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	602148
End bp	603227
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	32%
IMG OID	637901719
Product	peptide chain release factor 1
Protein accession	YP_507408
Protein GI	88657945
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0216] Protein chain release factor A
TIGRFAM ID	[TIGR00019] peptide chain release factor 1

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.349785
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTTTG ATAATAGTTT AGAAGAGTTG TCTCAAAAAT TCTACAAACT AAAAAGTATG 
TTAGAAGATC CAAGTCAATT GAGTGTGGAT TCCTTTGTTG CTGCTTCAAA AGAATATTCA 
GAATTATTGC CTGTGATATC AGTGATAGAC CAATATAATA TCTTACAAAA AGATATAGCA 
GGCTTAGAAG AACTGATAAA TAATCCAGAA ACTGATCATG AATTAAAAAG TCTAGCTAAA 
GAAGAATTCT ATGAACGGCA AAAACAATTA CCTAAAGTTA AGCATAAATT AAAATTATCC 
TTACTTCCCA AGGATAAAGA TGATGCACGT AATGCTATTT TAGAAATTAG AGCAGGTACA 
GGTGGAGAAG AAGCTGCATT ATTTGTGACT GATTTATATA GAATGTATAC AAAATATGCT 
GAACAAAAGA ATTGGAAATT TGAACAGATT AACTCATCTT CAACCGGTAT AGGCGGACAT 
AAGGAAATAT CATTATGTAT AAGCGGATCT AATGTATTTG CAAGGTTAAA ATTTGAATCT 
GGAGTGCATA GAGTACAAAG GGTACCGGAA ACTGAAGCTT CTGGAAGACT TCATACTTCA 
GCTGCTACAG TAGCAGTTTT ACCAGAAATT GAAGAAGTAG ATTTAAAGAT AGATGAAAAA 
GATTTAAGAA TAGATGTATA TCGTTCAAGC GGTCCAGGAG GACAATCTGT GAATACTACT 
GATAGTGCTG TACGTATTAC GCATATACCA AGCGGAATTG TCGTTATACA GCAAGATGAG 
AAATCTCAAC ATAAAAATAA AAGTAAAGCT CTTAAGGTAT TAAGAGCAAG GCTTTATAAC 
CTAGAAAAAC AAAAAAGAGA TGCAGAAATT TCACAAATGA GAAAAAGTCA GATAGGATCA 
GGAGACCGTT CTGAGCGTAT AAGAACTTAC AATTTTCCTC AATCTAGAAT TACAGATCAT 
AGGATAAATC TTACATTATA TAGATTAGAT GATATTATGA AAGAAGGAAA TTTGGATGAG 
TTTATTGAAG CATTAATAGC CGAAGATGAA GCAAATAAAT TAAAGAACCT GCATATTTGA

Protein sequence

MSFDNSLEEL SQKFYKLKSM LEDPSQLSVD SFVAASKEYS ELLPVISVID QYNILQKDIA 
GLEELINNPE TDHELKSLAK EEFYERQKQL PKVKHKLKLS LLPKDKDDAR NAILEIRAGT 
GGEEAALFVT DLYRMYTKYA EQKNWKFEQI NSSSTGIGGH KEISLCISGS NVFARLKFES 
GVHRVQRVPE TEASGRLHTS AATVAVLPEI EEVDLKIDEK DLRIDVYRSS GPGGQSVNTT 
DSAVRITHIP SGIVVIQQDE KSQHKNKSKA LKVLRARLYN LEKQKRDAEI SQMRKSQIGS 
GDRSERIRTY NFPQSRITDH RINLTLYRLD DIMKEGNLDE FIEALIAEDE ANKLKNLHI