Gene Pars_0036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0036
Symbol
ID	5054361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	29639
End bp	30784
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	51%
IMG OID	640467616
Product	small GTP-binding protein
Protein accession	YP_001152305
Protein GI	145590303
COG category	[R] General function prediction only
COG ID	[COG2262] GTPases
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR03156] GTP-binding protein HflX

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAAATA AGGCGCTCCT AGCCTATTCG GGCCCAAAGA CCCCCAATCT TGTTTACAAA 
CTGGAGGAAT TCGCTTCGCT GGTTGAGGTT GCTGGGTTCG AAGTTTCGGA GCTGGTGACC 
CAGTACGGGA GGGCGGACAC GCGGTTCTAT CTAGGAGCTG GCAAGGCGAG GGAGGTCGCC 
TCTAAGGATT TCGACGTATT CATAGCGTAC CACAGCTTAA CACCCCTTCA GGTTTTCAAT 
TTGGAACAGC TCTTCAAGAG GAGGGTGGTG GACAGGGTTT TTGTAATTCT GGTAATTTTT 
GAGAGGAGGG CGGGTAGTAT AGAGTCTAAG TTGCAGATCG AGCTCGCTAG GCTTAGGTAC 
GAACTGCCTA AGGTGAAGGA GTATTTGAGG AGGGCCAAGA TGGGGGAGCA ATTAGGCTTT 
CTGGGCGCCG GCGAGTATGT AATAGACTCG TACTATCGCC ACATGGTGAG GCGCATTTCG 
TCAATTAAAA AGAGGCTCGA GGAGGCGAAG AAGGGGAGGG TTATGCATAT AAAAAAGAGG 
AAAGAGGCCG GAGTCCCCGA GGTTGTGTTA ACCGGCTATA CAAGCGCCGG CAAAACTACG 
CTGTTTAACA GACTTGTGAG CGAGAATAAG ATCGTCGATG GGAGGCCCTT CGCGACGTTG 
GAGACCTACA GCAGGGCGCT GGATATATGG GGTAAGAGAG TTGTGTTGAC AGATACGATA 
GGCTTTATCG ATGATTTGCC TCCAGTCCTT ATAGAATCGT TCCACTCCAC GCTACAAGAG 
ATCATAGATG CCGATAGGAT CTTGTTGGTA ATAGACGGCT CAGAGCCTTA CGAGGAGGTG 
GCGCGGAAAA TCAGCACCTC GGTGAGAACA TTGGGAGAAG TAGGCGTAGA TCGCAGTAAA 
ATTATCCCAA TTGTTAACAA GGTGGATAAA ATAAGGCTAG AGGAGCTGAG GAACCTGAGG 
AAGGTGTTGG AAAAGTATTT CACGTGGTTT GTCCCGGTGT CCGCTCTCAC AGGCTTCGGC 
ATAGAGGCGC TTAAGGCCGT CTTGTTTTTC CAAGTGCCTG GCTACACAAT TGTTAGGGCA 
AGCGGCGATG GAAATCCGGT GGGGCTCCGT GTGGGCGACG TAGTTTTTGT GCCGGTAAAA 
GAGTAA

Protein sequence

MRNKALLAYS GPKTPNLVYK LEEFASLVEV AGFEVSELVT QYGRADTRFY LGAGKAREVA 
SKDFDVFIAY HSLTPLQVFN LEQLFKRRVV DRVFVILVIF ERRAGSIESK LQIELARLRY 
ELPKVKEYLR RAKMGEQLGF LGAGEYVIDS YYRHMVRRIS SIKKRLEEAK KGRVMHIKKR 
KEAGVPEVVL TGYTSAGKTT LFNRLVSENK IVDGRPFATL ETYSRALDIW GKRVVLTDTI 
GFIDDLPPVL IESFHSTLQE IIDADRILLV IDGSEPYEEV ARKISTSVRT LGEVGVDRSK 
IIPIVNKVDK IRLEELRNLR KVLEKYFTWF VPVSALTGFG IEALKAVLFF QVPGYTIVRA 
SGDGNPVGLR VGDVVFVPVK E