Gene Pars_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1842
Symbol
ID	5056206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1647859
End bp	1649178
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	49%
IMG OID	640469388
Product	isocitrate dehydrogenase, NADP-dependent
Protein accession	YP_001154045
Protein GI	145592043
COG category	[C] Energy production and conversion
COG ID	[COG0538] Isocitrate dehydrogenases
TIGRFAM ID	[TIGR00183] isocitrate dehydrogenase, NADP-dependent, prokaryotic type

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.282265
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGTTG ATATAGAGAA GATAAAACAG CAAATCCCAA ACCTCGTAAC TTTCACAGGA 
AAGTATATAG ATCCGCCGAG CGGAGAATAC GTCAAGTATA CAGGCCCGGG ACAGCTGAAG 
GTGCCTGATA AAGTAGTTAT AGGCTATATT GAGGGTGACG GAATTGGGCC AGAGGTTGCT 
TACGCCGCAA TTAAGGTCGC CAACGAGGCG GTGGAAAAGG CCTATGGAAA GTCTAGGCAA 
ATTACGTGGT ACGAAATCGT GGTTGGGGAG AAGGCAGAAA AGTTATTCGG CAACAGGTTG 
CCAGATCAAA GCATAGAGGT GTTGAGAAAG ATTAGAGTAT TCCTCAAAGC CCCTCTCGAA 
ACCCCTGTAG GGGGCGGGTT TAGAAGCATA AACGTGACGC TTCGCCAACT CTTCGACCTA 
TATGCCAACA TTAGGCCTGT GAAGTACTTC CCCGGCTTGC CATCGCCTCT TAGACGCCCA 
GAACTTGTAG ACTTGGTTAT ATTCAGAGAG AACACGGAAG ACGTCTACGC TGGTATAGAG 
TGGCCTTATA ACAGCCCAGA GGCGGCGAAA ATTAGGGAAT TTCTACGCAG GGAATTCGGC 
GTAAATATCA GAGATGACGC CGGCATAGGG ATAAAGCCTA TTAGCAAATT CGGTACTCAG 
AGAATTGCCA GACTTGCGCT AAAGTTTGCC ATTGAGAACA AGAGACGGGT CGTAACCGTT 
ATGCACAAGG GAAATATACA GAAATACACA GAAGGGGCCT TCAAAGAGTG GGCATTTGAA 
GTGGCTAGAA ACGAGTTCAG AGAACATGTG GTATTTGAAG ACGAGTTGGC TCAGTACGGC 
GGCTCTGTAC CACCAGGGAA GGTGCTTGTA AATGATAGAA TTGCCGATAA CATGCTCCAG 
CAACTACTTA CGCGCACGGG GGAGTACGAC GTAATACTTG CCCCCAACCT AAACGGCGAC 
TACGTCTCAG ACGAGGCCGC GGGCCTTGTG GGAGGACTTG GCGTCGCACC TGGCCTAGAC 
GTAGGCGACT GGGGAATGAT GGCAGAGCCT GTACATGGAA CAGCGCCTAA GTACAGGGGC 
AAGAACTACG TAAACCCAAC TGCCACAATA CTAGCTCTGG AACTGATGTT CCGCTTCCTA 
GGATGGAGAG AGGTTGCTGA GTATATTATG AAAGGCGTCG AGACCGCATA CAGAGAAGGA 
TATTTCACTG GCGACCTGGC TAGGCAGATG ACAGATGAGG AGAGAAAAAT GAGAGTCAAA 
GAAGTACTCG GCACGCAAGA GTTCGCAGAC AAAGTGGTGG AGATTATAAA AAGACTTTAA

Protein sequence

MSVDIEKIKQ QIPNLVTFTG KYIDPPSGEY VKYTGPGQLK VPDKVVIGYI EGDGIGPEVA 
YAAIKVANEA VEKAYGKSRQ ITWYEIVVGE KAEKLFGNRL PDQSIEVLRK IRVFLKAPLE 
TPVGGGFRSI NVTLRQLFDL YANIRPVKYF PGLPSPLRRP ELVDLVIFRE NTEDVYAGIE 
WPYNSPEAAK IREFLRREFG VNIRDDAGIG IKPISKFGTQ RIARLALKFA IENKRRVVTV 
MHKGNIQKYT EGAFKEWAFE VARNEFREHV VFEDELAQYG GSVPPGKVLV NDRIADNMLQ 
QLLTRTGEYD VILAPNLNGD YVSDEAAGLV GGLGVAPGLD VGDWGMMAEP VHGTAPKYRG 
KNYVNPTATI LALELMFRFL GWREVAEYIM KGVETAYREG YFTGDLARQM TDEERKMRVK 
EVLGTQEFAD KVVEIIKRL