Gene Pars_1080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1080
Symbol
ID	5055321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	966947
End bp	968281
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	64%
IMG OID	640468636
Product	hypothetical protein
Protein accession	YP_001153310
Protein GI	145591308
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1530] Ribonucleases G and E
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.108156
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTACAGGG CAAGGATTAG GGGGATTTAC GCCACTGCCT TGACTAAGCT GGCGCTGGAC 
TGGGGCTTCA AGGTGGTGCA ACCGACAGAG AAGATTGCCC GCCGCTTCGG CCTAGAGCCC 
GACTTCTCGC CGCCCGACAT CACCGTGAAG GACCACGAGT CTAAGACGGG GATTGTGGCG 
ATGGGCCTAT GCGAGGCGGT TGAGGCCTTT CTCTCAAAGC TTACGGAGTA CGCCGACCCC 
ATCGTGGCGA GGGCCAGGGC CCGGCTTAAG GAGGTTTTCG TGGGCAGGGC AGTGGGGGAG 
GCGACTGTGG AGGGGCCAGG CGGGGAGGTC TTTGACGTGC CCCGCCGCTA TGTTTTGACC 
CCCGGCGCAA CGGGCATCTA CACAGTGGTG AGGCCGCCCA TCGGCCCCCT CAAGGGCGTG 
GCGGCCCCCG AGATCGTGGT GGAGGGACAG TACGTCGAGC TCAACACCAC GGGCCGCGTC 
TCCTACAGCG AGCACATACC CGCCGAGGAG GCGGTCCGGC TTAGGATCCT CGCCGAGACG 
AGGCTCAGGC AGTACGCCTC GATAGGCCTT AGGTTTAAGT CCTCCGCCCG CTATGCTCCG 
GATGACGCCA TCGCCGCGGA GGCCGAGGCG CTTTATAAGG AGATGCTTGA AATCTCAAAG 
GGCGGCTCCC CGGGTCAGGT GCTTAGGCGG GGGAAGTGCT TTGCGGTAGT CCTCTTCGAC 
TCTGCGTCGA AGGCTAGGCT CGACGAGGCG AGGGCCGCCG TTGTGCCCAC CGTGAGGGGC 
CACCACGCAC TTAGGGCGCA GGGCCTTGGG AAGTGCCTAG ACCTCCTCGA CCACGTCGGC 
GGCGACGTCT ACGAGAAAGC CGCCGAGTTT TTGGCGGGAG AGGCGGCGGC GGTGTACCAC 
GTAAAGCCGT GGGGCGAGGT GGTGAAGATG CGGGCTGAGC CCGTCGGGGT TAGGGGCGGC 
GTCTTGGTGC TGAGGAGGCG GCTTAGGCCA GGCGGCGTGT TGGACGGCAT CGGCGTCAAG 
ATAGAGAGGG GGTTCTACGC CTTGACGTGC GTCCCACGGG GCAAGGGCTA CGTCGTACAC 
ACCTACTACA CAGCAGAGGG GAAAGCCGTG GGGACGTACG TAAACGCCAA CACGGTGCCC 
GAGTGGGGCC GCCGCGTTAT CTACATCGAC CTATTGGTGG ACAAGGCCTT CGACGGGGGA 
GGAGAGAGGG TGCTTGACCT GGATGAGTAC GAAAAATACG CCGAGATGTT CCCACAGAGG 
CTGAGGGACC CCCTCAGCAG ACTGCCCAAG ACGCCCATAT GGTGCACCGA GGAGGGCATA 
AAGACGGTCG CCTAG

Protein sequence

MYRARIRGIY ATALTKLALD WGFKVVQPTE KIARRFGLEP DFSPPDITVK DHESKTGIVA 
MGLCEAVEAF LSKLTEYADP IVARARARLK EVFVGRAVGE ATVEGPGGEV FDVPRRYVLT 
PGATGIYTVV RPPIGPLKGV AAPEIVVEGQ YVELNTTGRV SYSEHIPAEE AVRLRILAET 
RLRQYASIGL RFKSSARYAP DDAIAAEAEA LYKEMLEISK GGSPGQVLRR GKCFAVVLFD 
SASKARLDEA RAAVVPTVRG HHALRAQGLG KCLDLLDHVG GDVYEKAAEF LAGEAAAVYH 
VKPWGEVVKM RAEPVGVRGG VLVLRRRLRP GGVLDGIGVK IERGFYALTC VPRGKGYVVH 
TYYTAEGKAV GTYVNANTVP EWGRRVIYID LLVDKAFDGG GERVLDLDEY EKYAEMFPQR 
LRDPLSRLPK TPIWCTEEGI KTVA