Gene Pars_1675 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1675
Symbol
ID	5055888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1512648
End bp	1513955
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	55%
IMG OID	640469216
Product	hypothetical protein
Protein accession	YP_001153878
Protein GI	145591876
COG category	[R] General function prediction only
COG ID	[COG2403] Predicted GTPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAGAG TTGCAATTAT CGGAGCTGCC GGAAGAGACT TCCACGTCTA TAACACCGTA 
TACCGAGGCT CGCGAGAATA TAAAGTCGTG GCGTTTCTAA TGACCCAGAT CCCTATCCCA 
AACAGGAGAT ATCCGCCCTC TCTCTCGGGC GTGCCGGAAG GCGTTCCAAT ATACACCTGG 
AAAAGTTACG AGGAGTTGAC TAGATATCTA AAAGAGCTCC GTGTCGACGA GGCAGTCTTG 
GCGTTCAGCG ATTTGACCTA TGAGGATGTT GGCCACATAA TCTCAGCGGT GTTGGCCAGC 
GGCGCCTCAT TTAAAATACA CGGGCCCAAC GACACGTACC TAAATTCTAT AAAGCCCGTC 
ATCGCAGTAA CGGCAACTAG AACAGGCGCG GGAAAATCCA CTGTCTCCCG GGAGGTTGTA 
AGAGAACTCA CCTCGCGTGG GTTAAGGGTC GTGGCTGTGA GGCACCCTAT GCCGTACAGA 
GAGCTGGAGG ACAGCGTCGT GGAGGTATTC AAAAAGCCGG AAGACCTAGA GAAGCTTACC 
TTCGAGGAGA GAGAGGAGTA CGAGCAGTAC GTCGAGATGG GCGTGCCCGT CCTTGCCGGC 
GTGGACTACG GACTGGTGCT GAGGGAGGCA GAGAGGCACG GCGACGTTGT CTTGTGGGAC 
GGCGGCAACA ACGACTTCCC CTTCTTCAAG CCGGGCTTCA TGATTGTAGT TACCGACGCC 
AGGAGGGCTG GGCACGAGGT CGGCTCCTTC CCAGGAGAGG TCAACCTACG TCTAGCAGAC 
GCCGTGATAA TTACAAAGGT CAGTGACGCC GGGAGGGAAA ACGTCGAAAA AGTTGTGGCC 
AATGTCAAGA GGGTCAACCC CAGGGCCACC ATAACCAAGG CAGACCTAGA AGTCGGCGTC 
GACAGCAACA TATCGGGCAA GAGGGTACTG GTGGTCGAAG ACGCGCCGAC AGTCACCCAC 
GGAGGGTTGC CCTACGCCGC TGGCTACATT GCTGCGGTTA AATACGGCGC AGTTGTGGTA 
GACCCAAGAC CCTACGCCGT GGGCGTAATT AAAAAAGTGT ACGAAGAGTA CGGCACAGGG 
CCCGTCTTGC CAAGTCTGGG CTACACCGAG GAGCAGAAAC GTGACCTAGA AGAAACTATT 
AGAAGGGCCG ACGCAGACCT CGTGTTGCTC GCTACTCCTG CGAAAATTGA GCGCGTCGTC 
AAGATTGACA AGCCGATTGC GAGGGTCTCC TGGAGGCTTA AGGTAGTGGA AGGGCCGACA 
GTCAAAGAAC TTATTGATCG GTTCCTCGAA ACGGCGTCTC TACGCTAG

Protein sequence

MRRVAIIGAA GRDFHVYNTV YRGSREYKVV AFLMTQIPIP NRRYPPSLSG VPEGVPIYTW 
KSYEELTRYL KELRVDEAVL AFSDLTYEDV GHIISAVLAS GASFKIHGPN DTYLNSIKPV 
IAVTATRTGA GKSTVSREVV RELTSRGLRV VAVRHPMPYR ELEDSVVEVF KKPEDLEKLT 
FEEREEYEQY VEMGVPVLAG VDYGLVLREA ERHGDVVLWD GGNNDFPFFK PGFMIVVTDA 
RRAGHEVGSF PGEVNLRLAD AVIITKVSDA GRENVEKVVA NVKRVNPRAT ITKADLEVGV 
DSNISGKRVL VVEDAPTVTH GGLPYAAGYI AAVKYGAVVV DPRPYAVGVI KKVYEEYGTG 
PVLPSLGYTE EQKRDLEETI RRADADLVLL ATPAKIERVV KIDKPIARVS WRLKVVEGPT 
VKELIDRFLE TASLR