Gene Pars_1914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1914
Symbol
ID	5055272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1719320
End bp	1720609
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	52%
IMG OID	640469460
Product	hypothetical protein
Protein accession	YP_001154113
Protein GI	145592111
COG category	[R] General function prediction only
COG ID	[COG1341] Predicted GTPase or GTP-binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACTAC GCGTCATGAA AGCTGGCGAT ATTTACAGAA TTGAGGGTCC CGCCAAGGTG 
GTCGTTAAAC GTGGCCAAAT ATACGCAACA GGAGTGGTGT ACACCGAGGG GCAGAGCTTC 
ACCGTGTTAA GAGCACGGCA ACTTGCTGTG AAAGCTGTGG CTGACTCCGA GGTGGAGCTT 
GTTTTGGGCC CGGGGGCTCT TCTGGAAAGA GTGTCGCCTG GCGAGGAGAT TATTGACGAG 
TGGGAGAGAA GGATCTCCGG CGTGGATCCC AAGGGGGTTG TGGTTATCGT GGGGATGATG 
GATGTGGGGA AATCTACAAT GACTGCGATG CTTGGGAACA AGGCGCTGGC TAGGGGGTAC 
AAAGTTGTGA TTATAGACGC CGATGTTGGG CAGAACGATT TAGGTCCCCC TACCACCATA 
TCGTTGGCTA GGTTAACGAA GTATGTAACT CATTTAAGAC AACTAGTCGC CGAGAAGAGC 
TTATTTCTCC AGTCTACCAG TATGGAGAGG ATATGGCCCA GGGCGGTGGC GCAAATAGCG 
AAGGCTGTGG AGTATGCCAA AAAGACGTGG CAACCGGATA CTATCATTGT GAACACCGAC 
GGTTGGGTCC TCGACGAGGA GGCAGCAACT TTTAAACGGA GGCTCATAGA GAGGCTAGCC 
CCCTCGCTAA TTGTGGCAAT ACAGGTGGAG AACGAGCTGG GGCCTATTCT CAACGGCTAC 
AGCAACGTGT TAGTTCTCCC CCCGCCCCCG CACGTGAGGA CGCGGAGCCG TGAGGATAGG 
AAAATACACA GAGAAATGGG CTACGGCAGG TACATCTTCC CGCCCGTGGA ACTCGCCGTG 
TCTCTTGACA AAATTCCCCT CTGCAACTTG CCCCTCTTCC AAGGAATAGA GATGGGGGAA 
GAGCTCAAGA GAATGCTTAC ACGCGCAATA GGCGTCGGTG TGTTGAGAGC CTACCAGGTG 
GGGAGCAGAG TCTACGCAGT TGTGGAGGGA GGCGAGTGGG TGGTGAGACG GGTTGGCGGG 
TTCCAAGTCG TTGGACTTCC TATAGATTTC GAAAAAGGCC TCTTAGCCGG CCTCGAGGAC 
TCAGAAGGTT TTTTGGTAGG ACTCGGCGTA ATAAAGAAGA TTTATTACGA CAGGAAGAGA 
GCTATTATCT ATACGTCAAG CGAGGTTGAG AGAAGGATAG GCGAAGTAAA ATGCATAAGG 
CTGGGCTTAG TGAGGCTAGA TGACAACTTC AACGAGGTTG AAAAAGCCAC AAACATACTC 
AAAGCAGAGG CTGAGCAGTC AACAACGTAG

Protein sequence

MSLRVMKAGD IYRIEGPAKV VVKRGQIYAT GVVYTEGQSF TVLRARQLAV KAVADSEVEL 
VLGPGALLER VSPGEEIIDE WERRISGVDP KGVVVIVGMM DVGKSTMTAM LGNKALARGY 
KVVIIDADVG QNDLGPPTTI SLARLTKYVT HLRQLVAEKS LFLQSTSMER IWPRAVAQIA 
KAVEYAKKTW QPDTIIVNTD GWVLDEEAAT FKRRLIERLA PSLIVAIQVE NELGPILNGY 
SNVLVLPPPP HVRTRSREDR KIHREMGYGR YIFPPVELAV SLDKIPLCNL PLFQGIEMGE 
ELKRMLTRAI GVGVLRAYQV GSRVYAVVEG GEWVVRRVGG FQVVGLPIDF EKGLLAGLED 
SEGFLVGLGV IKKIYYDRKR AIIYTSSEVE RRIGEVKCIR LGLVRLDDNF NEVEKATNIL 
KAEAEQSTT