Gene Pars_1859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1859
Symbol
ID	5056008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1661857
End bp	1663776
Gene Length	1920 bp
Protein Length	639 aa
Translation table	11
GC content	56%
IMG OID	640469405
Product	putative molybdopterin biosynthesis protein MoeA/LysR substrate binding-domain-containing protein
Protein accession	YP_001154062
Protein GI	145592060
COG category	[H] Coenzyme transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme [COG1910] Periplasmic molybdate-binding protein/domain
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.693636
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGA GAGTTATATT CCACGACCTG GTTACGCTGG AGCAAGCTTC GGAGATTTTG 
CTAAAGTTTG CAAAGCCGCT GGGGGAGGAG GAGGTGGACA TTGTTGCGTC GTATGGCCGG 
GTGCTGGCCC GTGATGTAGT TGCGCCTATT GACGTGCCGC CTTTCGACCG CTCTACCGTA 
GATGGGTTTG CAGTGGTGGC CGCGTCCACA TATGGGGCTT CTGAACTTAC GCCAGTGGAG 
CTTAGGCTAG TCGGCAGGGT GGAAGCCGGC GGTTGGCCTC AGGGAGAGGT GAAGGCTGGT 
GAGGCCTACG AGGTGGCAAC CGGCGCGCCG ATACCCAGGG GTGCAGACTC TGTTGTAATG 
GTTGAGTACA CCCAGGAGAG GGATGGTGTA GTAAGGATTT TCCGACCGGT GGCGCCTGGG 
GAGAACTTAA TGAGCGCGGG GTCGGACATT TCAGCTGGGG AGGTGGTGCT GAGACGTTGC 
ACAAGACTCA CGGCCAGGGA AATAGGCGTA TTGGCCGCGC TGGGCATGAG GAAGGTAAGA 
GTCATAAAAA GGCCTAAGGT TGGGATAATC TCGACGGGCG ACGAGCTGAC ACCGCCGGGG 
AAGCCGCTTG GCCCGGGCAA ACTGTACGAC GTAAACACTT ACACCCTAAT AGCGGCTGTT 
GCAGAAGCCG GCGGAGAGCC GATTCCATAC GGTATTGTGG AAGATGTAGA AGAGAGCTAC 
CGTGCCGCGA TCGCCAAGGC TCTTTCTGAA ACAGACGTGG TTCTCATAAG CGGGGGGACG 
TCGGCGGGCG TCGCAGACCT CACATACAGA GTACTCGGCG AATTGGGCGA CGTGCTCTTC 
CACGGCGTGA TGGTCAAGCC AGGAAAGCCC ACTCTGGCCG CAGTTGTCAA CGGGAAAATA 
GTCGTAGGCC TGCCGGGGTA TCCCTCCTCT GCCTTGATGA TCTTCCACAC AATAGTAAGA 
CCCTTCCTTC TAAGACTACA GTGCCTAGAA CCTATGCCCC CCGCCGTGTA TAAGGCGAGG 
TTGGCGTACG GCATAGAGGG GGCAAAGGGA AGGCGTGCTT TATACCCAGT AGTCCTCATC 
GCGAGGAGGT CTGAGTATAG GGCCTATCCC CTCTACGCGG AGTCGGGGGC AATATCGGTG 
CTGGCGAGGG CCGACGGCTA CATAATAGTG CCGGAAAACG TCGAGTTTAT GTCAGAGGGG 
GAGGAGGTGT ATGTTTACCT TTTCGAGAAG TATAAGCCCT CTGACCTCTA CTTCATCGGT 
AGCCACGACC CCCACCTAGA CGCAGTGCTC GCCAGACACA ATGTCAAGAC GGTATACGTC 
GGATCTTTGG GCGGCCTAAT GGCGTTAAAG AGGGGCGAGG CCGACATGGC GGGAGCACAC 
ATATACGATC CCGAGACCAA CGCCTATAAC GTCCCCTACG TTAAGAAGTT GAGGATTACA 
AACGTCGCCG TGGTAGGGCT ATACAAGAGG GAGCAGGGGC TAATCGTGAA GAGGGGTAAC 
CCCAAGGGGA TAAGGGGGGT TGAAGACCTT TTGAGAGGCG ACGTGGTGTA TGTAAATAGA 
CCAAGAGGCA CAGGTACGAG GGCCCTCCTA GACTTGCTTC TTTCCGAGCT GGCGGAGAAG 
ATGGGCACCA CGCTGGAGTC GTTGGCTAAA AAAATTAGGG GCTACACCTA TGAGGTGAAG 
ACACACACAG CCGTCGCTGC CGCCGTAGCC CAGGGCAGAG CCGACGTGGG CCTCGGGGTG 
AGATACGCCG CCGAGCTCTA CGGGCTTGAC TTCATACCCA TAGGCTGGGA GGAGTACGAC 
ATAGTCGTGA GAAAATCCGT CTTAGACAAG GCTATGGAAA TTGTAGAAGA GGCTCTTGAG 
AACCTTCCGC CAGGGTACCA GCCATATGAA CACTCAAGAA AAATAAAATT CGAGAATTAG

Protein sequence

MSKRVIFHDL VTLEQASEIL LKFAKPLGEE EVDIVASYGR VLARDVVAPI DVPPFDRSTV 
DGFAVVAAST YGASELTPVE LRLVGRVEAG GWPQGEVKAG EAYEVATGAP IPRGADSVVM 
VEYTQERDGV VRIFRPVAPG ENLMSAGSDI SAGEVVLRRC TRLTAREIGV LAALGMRKVR 
VIKRPKVGII STGDELTPPG KPLGPGKLYD VNTYTLIAAV AEAGGEPIPY GIVEDVEESY 
RAAIAKALSE TDVVLISGGT SAGVADLTYR VLGELGDVLF HGVMVKPGKP TLAAVVNGKI 
VVGLPGYPSS ALMIFHTIVR PFLLRLQCLE PMPPAVYKAR LAYGIEGAKG RRALYPVVLI 
ARRSEYRAYP LYAESGAISV LARADGYIIV PENVEFMSEG EEVYVYLFEK YKPSDLYFIG 
SHDPHLDAVL ARHNVKTVYV GSLGGLMALK RGEADMAGAH IYDPETNAYN VPYVKKLRIT 
NVAVVGLYKR EQGLIVKRGN PKGIRGVEDL LRGDVVYVNR PRGTGTRALL DLLLSELAEK 
MGTTLESLAK KIRGYTYEVK THTAVAAAVA QGRADVGLGV RYAAELYGLD FIPIGWEEYD 
IVVRKSVLDK AMEIVEEALE NLPPGYQPYE HSRKIKFEN