Gene Nmul_A2641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2641
Symbol	prfA
ID	3785252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	3026322
End bp	3027398
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	58%
IMG OID	637812730
Product	peptide chain release factor 1
Protein accession	YP_413320
Protein GI	82703754
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0216] Protein chain release factor A
TIGRFAM ID	[TIGR00019] peptide chain release factor 1

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAA GTATGACTGC CAAGCTCACG CAACTCAGCG TGCGCCTGGA GGAGTTGAAT 
CGTCTGCTGA GCAGCGAAAG CATCACGGTC AATCTCGATC AATACCGCAA GCTGACGCGC 
GAACGTGCGG AGATTGCCCC CGTGGTCGAC CTGTATAACG CTTATCTGCA AAGCGAGCAG 
GATATTCATA CCGCGCAGGA GATGGCTGCC GAGGCGGAAA TGCGCGAGTT TGCCGATGCC 
GAGATACGGG ATGCCAAAGA GAGGCTGGTG CGTTATGGCG CGGAATTGCA GAAGCAATTG 
CTGCCCAAAG ACCCGAACGA TGAGCGCAAT ATTTTTCTGG AGATCCGGGC CGGTACCGGA 
GGAGACGAGT CCGCGCTGTT TGCGGCGGAC CTGTTCCGCA TGTATGCACG CTTTGCTGAA 
CGCCAGCGCT GGCAGGTGGA AATCATTTCG CAAAGCCCGT CCGACGTCGG CGGATATAAG 
GAAATCATTG CCAAGATCAG CGGTGAAGGC GCCTATTCCA AACTCAAGTT TGAATCGGGT 
GGGCACCGGG TGCAGCGCGT GCCAGCGACC GAAACGCAGG GACGTATCCA TACTTCCGCT 
TGCACCGTCG CGGTGATGCC GGAGGCAGAC GAGATCGAGG ATGTCGCGCT CAATCCTGCC 
GAGCTGAGGA TCGATACTTT CCGTGCTTCC GGGGCGGGAG GCCAGCATAT CAACAAGACT 
GATTCTGCCG TGCGCATCAC TCACCTGCCG ACGGGAATCG TGGTCGAATG CCAGGATGGC 
CGTTCCCAAC ATAAAAACAA GGCGCAGGCG ATGAGCGTGC TGGCTGCGCG CATCCGCGAC 
AAGCAGATGC AGGAGCAGCA AAGCAAACAG GCGGCAACGC GCAAGTCGCT GGTAGGCACG 
GGTAATCGTT CAGGACGTAT CCGCACTTAC AATTTTCCCC AGGGGCGGAT AACGGATCAC 
CGCATCAATC TGACGCTGTA CAAGATCGAG CAGATCATGG ATGGGGATTT GAACGAGCTT 
TGCTCGGCCC TGCTGGCCGA GCATCAGGCC GAGCAGTTGG CGGCAATGGC GGAGTAG

Protein sequence

MNKSMTAKLT QLSVRLEELN RLLSSESITV NLDQYRKLTR ERAEIAPVVD LYNAYLQSEQ 
DIHTAQEMAA EAEMREFADA EIRDAKERLV RYGAELQKQL LPKDPNDERN IFLEIRAGTG 
GDESALFAAD LFRMYARFAE RQRWQVEIIS QSPSDVGGYK EIIAKISGEG AYSKLKFESG 
GHRVQRVPAT ETQGRIHTSA CTVAVMPEAD EIEDVALNPA ELRIDTFRAS GAGGQHINKT 
DSAVRITHLP TGIVVECQDG RSQHKNKAQA MSVLAARIRD KQMQEQQSKQ AATRKSLVGT 
GNRSGRIRTY NFPQGRITDH RINLTLYKIE QIMDGDLNEL CSALLAEHQA EQLAAMAE