Gene Pars_0084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0084
Symbol
ID	5054897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	76955
End bp	78016
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	57%
IMG OID	640467662
Product	hypothetical protein
Protein accession	YP_001152351
Protein GI	145590349
COG category	[R] General function prediction only
COG ID	[COG1341] Predicted GTPase or GTP-binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAGAG TCGCGGTCCC CAAGGGCGAC ACTGCCCTTG TAAGAGGGCC GGCCGAGGTT 
CATTGCCTAG ACACGTGCAG AGTCTTCGGA GCGGTGTTCC AGCACTTCGC CGTTCCGCCC 
CACAAGCAGT ACCCAGTAGA GGGCCCCGCA GTTTTTGAGC TCGAAGGCGG ATCGCTGATC 
TTAGTAAAGG GATCAACGAC GCCGCAGGAC TGGGCGCAAC TGCTTGAAGG AGTTGTGGCA 
TTGGTGGGGC CTACGGACTC GGGGAAAAGT AGCCTCACGA CGTATTTGCT AAATCTGCAC 
GTCGCCAGAG GCAAAAAAGT CTGTGTGGTA GACGCCGACG TCGGCCAGTC CGACATAGGG 
CCTCCAGGAT TCGTCGCGTA TAGTTGCACC TCGGCTCCGG TTCCCCATAT AGCGGAGCTG 
GAGCCGTTTG ACGCGTACTA CGTCGGCTCT GTGAATCTCC AGGGAATGGA GGAATTGTTA 
ATAGCGGGCG TAGTTCGGTG CCTCAGAAAG GCCATGGCGC AATACCCCCA CCTCGTTATT 
ATAAACACGC CGGGATGGAC CACGGGAAGA GGCGTGCAGT TGTTAAGGGC GTTGGCAGAC 
GCAGTGGAGC CAGAGGTTAT AAACATAGGG GAGAAGGTGT TGCCAGGCCT TGCGGTGTCG 
AAGCCTCCCC ACATCTATCC AAGAGGCCCG CAGGAGAGGA AGGAGCTGAG GAACTACGCG 
TTCAAGAGGC ATATCAAACC AGTTGCCAAA GTACAGATAG AGCCTGACAT AGTTGCCAAC 
TGCCGGTGGG ACGGCTCACT GAACTGTCCC TGGGGGAGGT ACACACCTGC CGAGGTGAAG 
GAGCCGGAGA AGAGGGGTAG GGATTATTTA GTGCCGCCGC ACTACCTGAA ACACCTGCTG 
GCGGCGCTCT ACAGAGGCGG AAGACTTGCG GGATACGCAA TAGTGGAGAG GCTGGAGCCT 
AAAATAGTCA TGTATTCTAC GACACACGAA TTCGACGAGG TGAGAATCGG CAAGATCAGG 
CTAGACCCCC AGACCTTAGA AGAACTTGAG CCGTTGCCCT AG

Protein sequence

MFRVAVPKGD TALVRGPAEV HCLDTCRVFG AVFQHFAVPP HKQYPVEGPA VFELEGGSLI 
LVKGSTTPQD WAQLLEGVVA LVGPTDSGKS SLTTYLLNLH VARGKKVCVV DADVGQSDIG 
PPGFVAYSCT SAPVPHIAEL EPFDAYYVGS VNLQGMEELL IAGVVRCLRK AMAQYPHLVI 
INTPGWTTGR GVQLLRALAD AVEPEVINIG EKVLPGLAVS KPPHIYPRGP QERKELRNYA 
FKRHIKPVAK VQIEPDIVAN CRWDGSLNCP WGRYTPAEVK EPEKRGRDYL VPPHYLKHLL 
AALYRGGRLA GYAIVERLEP KIVMYSTTHE FDEVRIGKIR LDPQTLEELE PLP