Gene Pars_1315 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1315
Symbol
ID	5055924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1186556
End bp	1187806
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	59%
IMG OID	640468861
Product	RNA modification protein
Protein accession	YP_001153530
Protein GI	145591528
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0621] 2-methylthioadenine synthetase
TIGRFAM ID	[TIGR00089] RNA modification enzyme, MiaB family [TIGR01578] MiaB-like tRNA modifying enzyme, archaeal-type

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.107305
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAAGGG CCTATATAGA GACTTATGGT TGTTGGCTGG CTAAGGCCGA TGCGGAGATC 
ATCAGACAGA GACTGGGGCT TGTGGCTGTG GAAAGGCCCG AGGATGCCGA CGTGGTGATG 
ATCTATACAT GCGCGGTGAG GGAAGACGGC GAGGTTCGCC AGCTTGCAAG AATAAGGGAG 
CTTGCGGGTC TACGCAAGGA GGTTGTGGTG GCGGGTTGTC TCGCCAAGCT GAGGCCGTAT 
ACGATTAAAT CCGCAGCGCC TAACGCGCGT CTGTTATACC CCTCTGAGGT GGAGGGTGGG 
CAGAAGAGGG AGATGAAGGT ACTGCCCAGG TACGAGGGCG GCGTCATTTA CACGGTGCCT 
CTACAGGTCG GTTGCCTCGG CAACTGCACC TTCTGCGCTA CTAAGTACAC GCGGGGTGGC 
GCCGGCTACG TCAAGAGTGC CAATCCCGAC GACGTGGTGC GCCACGTGAA GGAGGCCGTG 
GCGAGGGGGG CGAAGGAGAT CTACCTGACA GGTCAAGACG TCATTACCTA CGGTTTCGAC 
ATGAGGTGGA GGCCCGGCTG GAGCCTGCCG GATCTCCTGG AGCGGATATT GAGGGAGGTG 
GAGGGGGAGT ACAGGGTTAG GATAGGCATG TCGGAGCCTT GGGTATTTGC GAGGTTTGCA 
GATCGTCTCC TCGACATTGT TAAGGGCGAC CGCCGGGTGT ACCGATACTT CCACCTCCCG 
GTGCAGTCCG GAAGCGATAG GGTGCTTAGA GCGATGGGGC GGAGATACAC CGTTGATGAG 
TATAGGGAGC TTGTGAGGAA GATTAGGAAG ACGTTGGGAG AGTTCGCCTT TGTCGCCACC 
GATATCATAG TCGGCTTCCC CGGCGAGGCT GAGGACGACT TCTGGGAGTC GGTGAAGCTG 
GTGGAGGAGC TCCAGCTGGA CAAGGTGCAC GTGGCTAGGT TTAGCCCGAG GCCCTTCACA 
GAGGCCGCTG TCATGCCTAG ACAAGTCCCC GACGCGGAGA AGAAGAGGAG GAGCAAAATC 
CTGAGTGAGG TCTCTCTTAG AGTGGCCCGT CTGAGAAACG GCCTGCGTGT GGGGAGCCGT 
GACGTCGTCT TAATCGACGA GGTTGACCAC GGGTTGGTTG TCGGCCGCGC AAGCGACTAC 
AGACAGGTGG TGGTGAAAAG GGGCCACGGC GACGGCCTCA TTGGCCAGTA CAGAGAAGTC 
CAGATAGTCG CCGCTGGCGC AGTCTACCTC TACGGCGACA TTGTAGAGTA G

Protein sequence

MARAYIETYG CWLAKADAEI IRQRLGLVAV ERPEDADVVM IYTCAVREDG EVRQLARIRE 
LAGLRKEVVV AGCLAKLRPY TIKSAAPNAR LLYPSEVEGG QKREMKVLPR YEGGVIYTVP 
LQVGCLGNCT FCATKYTRGG AGYVKSANPD DVVRHVKEAV ARGAKEIYLT GQDVITYGFD 
MRWRPGWSLP DLLERILREV EGEYRVRIGM SEPWVFARFA DRLLDIVKGD RRVYRYFHLP 
VQSGSDRVLR AMGRRYTVDE YRELVRKIRK TLGEFAFVAT DIIVGFPGEA EDDFWESVKL 
VEELQLDKVH VARFSPRPFT EAAVMPRQVP DAEKKRRSKI LSEVSLRVAR LRNGLRVGSR 
DVVLIDEVDH GLVVGRASDY RQVVVKRGHG DGLIGQYREV QIVAAGAVYL YGDIVE