Gene Pars_1844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1844
Symbol
ID	5056182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1649924
End bp	1651093
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	51%
IMG OID	640469390
Product	TGS domain-containing protein
Protein accession	YP_001154047
Protein GI	145592045
COG category	[R] General function prediction only
COG ID	[COG1163] Predicted GTPase
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.262151
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCTA ATCTTCCTGC TGAGGCCAAG GCTGCTTGGC TGAAGGTGAT GGAGGCGAAG 
ACTCCTGAAG AGAAGCTACG GGCCATGGAA GAGTTCTTAT CCGCAGTGCC TAAGCACAAG 
GGTACTGAGA AGCTGATTAA GCACATTCGG AGGAGGATGG CCGAGCTTAG GAGAGAGCTC 
CAGGAGAGGC GTGAAAAGGC GCGTGCCGTG CGGGGCGGAG GGGGGGCGCG ACTTTACGTT 
GCCAAAGAGG GGGATGTGCA AGTCGCTGTC GTGGGCCCGC CTATGTCTGG CAAAACGGCG 
TTGTTGAGAT GCCTTACCAA CACTCACCTC GAGCCTGACG AACTCCCCTT TTCCACTGTC 
GAGCCCATCC CGTCTATGTT TGTGGAGGAC GGCGTATATG TACAGCTGGT GAAAACGCCT 
AGCTTAGTGC TGGACCAGAG TAGTGATCTT AACACAGTGA CGCTGGCGAC TGTGAGAAAT 
GCCGATGCGG TGATGTTGGT GGTAGACGCT AACAATAACG CAACGCTTCT GCACAGAATA 
ATACAGTTTT TTGAAGACGA GGGGATCTAC CTAACCCCTC CGACTAACTA CGTAAAAATT 
GAGCGGAAGG GGCTGGGCGG CGTCCAGATA GTTGGTTCTG GCAAAATCGT AGGGGGGACG 
TTGAGCGATG TTAAGAAGCT TCTACACGAG TACGGCATAT ACCACGCAGT GGTGCACATA 
GAGGGGGTTG TATCTCTTGA CGAAGTAGAG GAGGCTTTGT ACTTAGACAA GATGTATAAG 
CCTACTATAG TAATAATGTC AAAAGTCGAT TTATACCAAG TTAATAGAGA AGTAGAGGAG 
TTTTTTACGA AGGCCGGCGT TAAGTACTAC AAGACCGATT TGAGGGTGTG TAATCTCGAT 
AGGAGGAGAC TACTTGAGGA TATTCTACAA GCCACGGGGC GTATAAGAGT TTTTACAAAG 
CCGGTTCATT CCAAGTGGTA CGTAGAGAAG CCAATTGTTG TGAAAGCAGG CTCAACAGTC 
GGCGACGTTG CCGCCATGAT TCATTCATCG CTCGCCGAGA CGTTTAAGTA CGCTATTGTG 
TGGCGCAGAG ATCAGTATCC CAACTGGCCT AAACGCGTGG GCCGCGACTA CGTCTTGTCC 
GACAACGATG TAGTGGAAAT ACATGCATGA

Protein sequence

MPANLPAEAK AAWLKVMEAK TPEEKLRAME EFLSAVPKHK GTEKLIKHIR RRMAELRREL 
QERREKARAV RGGGGARLYV AKEGDVQVAV VGPPMSGKTA LLRCLTNTHL EPDELPFSTV 
EPIPSMFVED GVYVQLVKTP SLVLDQSSDL NTVTLATVRN ADAVMLVVDA NNNATLLHRI 
IQFFEDEGIY LTPPTNYVKI ERKGLGGVQI VGSGKIVGGT LSDVKKLLHE YGIYHAVVHI 
EGVVSLDEVE EALYLDKMYK PTIVIMSKVD LYQVNREVEE FFTKAGVKYY KTDLRVCNLD 
RRRLLEDILQ ATGRIRVFTK PVHSKWYVEK PIVVKAGSTV GDVAAMIHSS LAETFKYAIV 
WRRDQYPNWP KRVGRDYVLS DNDVVEIHA