Gene Pars_2210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2210
Symbol
ID	5054387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1982493
End bp	1983539
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	59%
IMG OID	640469763
Product	RNA 3'-terminal-phosphate cyclase
Protein accession	YP_001154408
Protein GI	145592406
COG category	[A] RNA processing and modification
COG ID	[COG0430] RNA 3'-terminal phosphate cyclase
TIGRFAM ID	[TIGR03399] RNA 3'-phosphate cyclase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.098436
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTGTCC GGATCGACGG CTCCTACGGG GAGGGCGGAG GCCAAATTTT GCGGACGTCA 
ATTGCCTTAT CCGCTCTCTT GGGCAAGCCT GTGGAGATAA TAAACATACG GGCTAAGAGG 
GCGAACCCGG GGCTCCAGCC GCAGCACCTC ACCGGCGTGA GGGCCGCCGC CTTGCTTACA 
GACGCCGAAG TGGAGGGAGC CGTTAAGGGC TCCACGAGGC TGTTCTTCAA GCCCAGGGAC 
ATTAAGTGTG GGTCCTTCGA CATAGACATA GGCACTGCTG GTAGCATCTC CCTAGTTGTC 
CAGACCCTCG CCCCGGTTTT GCTGTTCGCC CCGTGCCCCA CCCGAATAGC CATCTCCGGC 
GGCACGGACG TGTCGTGGTC GCCTCCCATC GACTATATGC GGTTTGTATT CGCAAAGGTC 
TTATCCCTAT TCGGCGCAAG GGTGGAGATA GAGCTTATAA GGCGTGGCCA CTACCCCAAA 
GGAGGGGGGA GGGCGGTGCT GAGAGTAGAG CCGGTGAAAA AGCTCTCACC CGTGAGTTTA 
GAAGAGTTCG GGAAGGTACT GGAAATACGC GGGATATCCC ATGCCGTAAA TCTCCCGAGC 
CACGTGGCGG AGAGGCAGGC TAGGGCGGCC GCCGAAGTCT TGGCAAAGCT GGGGTACAGA 
GCCGAGATAT CAACGGAGGT GCGGGCCGAC GGCCTTGGCC CCGGCAGCGG TGTTGTCCTC 
TGGGCCTACT CGGAAAGCGG AAGCACCGTA GGCGGGGACT CATTAGGAGA GAAGGGAAAG 
CCCGCCGAGG TAGTTGGCCG CGAAGCCGCC GAGAAGCTTG CCGCCGTGCT TAAAACCGGC 
GCCACGTTGG ACCCCCACAT GGCCGACATG GCAGTTGTGT ACATGGCACT GGCCGACGGG 
AGGAGCAGGC TGAGCACATC AGAAGAGACT ATGCACCTCA AGACAAACAT CTACATCGTG 
GAGCAGTTCT TGCCAGTGAA GTTCAAGGTG GAAAAACAGG CGGCAAGATA TGTACTAGAA 
GTAGACGGAG TAGGCTACAG CAGATAG

Protein sequence

MVVRIDGSYG EGGGQILRTS IALSALLGKP VEIINIRAKR ANPGLQPQHL TGVRAAALLT 
DAEVEGAVKG STRLFFKPRD IKCGSFDIDI GTAGSISLVV QTLAPVLLFA PCPTRIAISG 
GTDVSWSPPI DYMRFVFAKV LSLFGARVEI ELIRRGHYPK GGGRAVLRVE PVKKLSPVSL 
EEFGKVLEIR GISHAVNLPS HVAERQARAA AEVLAKLGYR AEISTEVRAD GLGPGSGVVL 
WAYSESGSTV GGDSLGEKGK PAEVVGREAA EKLAAVLKTG ATLDPHMADM AVVYMALADG 
RSRLSTSEET MHLKTNIYIV EQFLPVKFKV EKQAARYVLE VDGVGYSR