Gene Pars_0409 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0409
Symbol
ID	5054842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	356595
End bp	357992
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	61%
IMG OID	640467974
Product	phytoene dehydrogenase-related protein
Protein accession	YP_001152661
Protein GI	145590659
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID	[TIGR02734] phytoene desaturase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGCTA TCGTGATAGG GGGCGGCTTC GGCGGGCTGG CCTCTGCGGC TTTACTCGCA 
AAACGGGGCT ACGAGGTTGT TTTGGTAGAG AAGAACTGCA GACTTGGCGG CAGATCTGTT 
CTTTACGACA TCCGTGGCCA CAGGGTCGAG ATAGGTCCGA CGTGGTACCT AATGGACGAC 
GTCATAGACA AGGTGTTGGG CGAGATCGGC GGTAGGACGT ACGAGGTGGC TGAGCTTAAC 
CCCAGTATGA TGTTCGTGGA CAGGCGCCAC GGCAAGATCG AGGTAGGGAG AGATCTGCCG 
CAACGCCTTG AAGAGCTGGA GCAGGGGGCG GGGGATCGTT CTGTTGAGCT CATGCGCGAA 
GCTGGCAGGC TGTATCAAGT TGTCGTGGAG CACATGTTGC TGAGAAAGTA CGAGACGTGG 
CTCGACATGC TGTCGGCCGC AAAGGCCGGG GCAGGTTTCG CCAAGTACCT CGTGACCAGC 
TTCGGAAGCC TTGTGGAGAG GAGGTTTAAA TCGCCTTTAA TACAGCGCCT TTTGGAGTAT 
GATATCATGT TTCTAGGGAG CCCCCCGCGC GAGTTGCCCG CGCTCTACGG CCTACTTCTT 
AACTACTCCG TCTTCGTGAG AGGTGTTAAG GCGCCTAAGG GCGGCTTCGC CGCTGTTATC 
CGTAATTTAA TAGAAGCCGG GGCCCGACTG GGGGTAGACT TCAGGACATG CACAGCGGCG 
AGGAGGATTT TGGTGGAGGG CGGCAAAGTG AGGGGCGTGG AGACAGCCAG CGGGGTTTTG 
GAGTCGGACG TGGTGGTGAT CAACGCCGAC TACAAGCGAG GCGAGGAGCT TCTGGAGCCC 
CGGTACAGAT CTTACGGCGA GGCTTACTGG GGCCGGGTCA AGATGGCGCC GTCTGCGTAC 
ATGGCGTTGC TGAGCGGGGA TCGGTGGGAG GGGCCGCCCC ACTTGATATA CATCTCTGAG 
TGGGAGCGAC ACCTATCGGC CCTTACCGGC GGCGGGGATA TGCCTCAGCT CCCCTCTTTC 
TACCTCCACG TGCCCAGCGT AGTGGAGCCC GACTGGGCCC CACCCGGAAG GTCGAGCATG 
TTTATCCTAG TGCCTTCGCC GCCTGGAGTA GACTATTGGC CAAGGGGGCT AGCCGAGAAG 
CTAGCGGCGG AGGCCACCGG CGGCTCGGCC GAGACGCTGG CGGAGTTTCC CAGCCGCTTC 
TTCTGCGACT ACTACGGCGC CTACCAGTGC ACGGCGCTTG GCCCCAGGCA CACGCTACGC 
CAGACCGCCC TGGGCAGGCC TTTAATGAGA GGCCGAATGG TACGTGGGCT GTACTTCGTG 
GGGCAGTACA CCCATTCGGG CATCGGCGTG CCATCGGTGC TGGCCTCGGC GTACATCTTG 
GCTCGGTACT ATGTCTAG

Protein sequence

MRAIVIGGGF GGLASAALLA KRGYEVVLVE KNCRLGGRSV LYDIRGHRVE IGPTWYLMDD 
VIDKVLGEIG GRTYEVAELN PSMMFVDRRH GKIEVGRDLP QRLEELEQGA GDRSVELMRE 
AGRLYQVVVE HMLLRKYETW LDMLSAAKAG AGFAKYLVTS FGSLVERRFK SPLIQRLLEY 
DIMFLGSPPR ELPALYGLLL NYSVFVRGVK APKGGFAAVI RNLIEAGARL GVDFRTCTAA 
RRILVEGGKV RGVETASGVL ESDVVVINAD YKRGEELLEP RYRSYGEAYW GRVKMAPSAY 
MALLSGDRWE GPPHLIYISE WERHLSALTG GGDMPQLPSF YLHVPSVVEP DWAPPGRSSM 
FILVPSPPGV DYWPRGLAEK LAAEATGGSA ETLAEFPSRF FCDYYGAYQC TALGPRHTLR 
QTALGRPLMR GRMVRGLYFV GQYTHSGIGV PSVLASAYIL ARYYV