Gene Pars_2059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2059
Symbol
ID	5054760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1840451
End bp	1841920
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	57%
IMG OID	640469608
Product	2-isopropylmalate synthase
Protein accession	YP_001154257
Protein GI	145592255
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR02146] homocitrate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0773223
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTATATA GCTGGCTAAG CTTTTTAAAT AGTTGTTATC TGTGGTGGCA TGTCCCAGGG 
GAAAGCCGCG TCTCAATACT AGACTCAACG CTTAGAGAAG GAGAGCAGAC TCCAGGGGTT 
GTATTCTCGG AGGAGTGGCG TGTTAGAATT GCCAAGGCCC TCTCGGATAT AGGCGTTGGG 
ATGATAGAAG TGGGCGATCC CAGCGTGGCC CCCGACATAA AGTCGGCGAT AAAGAAGATC 
GTTAAGTTGA AGAAGGACGG CGAGATTAGA AGCCATATCG TCGTCCACAG CAGGGCGGTG 
AAGCAAGATC TGGAAAACGC CGCGTCTCTG GAGCCGGATA GGGTCGCGGT GTTCTACGGG 
GTGAGCGACT TGCACTTGAA GCACAAGCAC AGGAAGACGA GGGAGGAGGC GCTGTCCATA 
ATTGCAGAGA TGGTCTCCTT TGCCAAGTCA CACGGCGTTG CTGTTAGGTT CACCGCAGAG 
GACGCATCGA GGGCCGATCT CGGCTACTTG ATAGAGGTCG TAAAGACCGC ATATGAGGCC 
GGCGCGGATC GGGTCAGCAT AGCGGACACG GTAGGGGTCT TCACGCCGGA CAGAGCCAGG 
GAGGTGTTCG CCAAGGTGAA GGCCGCCGTG CCGGGGGTTG GGCTGGACAT ACACGCACAC 
AACGACTTCG GGATGGCCGT GGCCAACAGC TTGGCGGCGG TTGAGGGCGG GGCAGACGTA 
GTCCACACCA CGGTGAACGG GCTTGGGGAG AGGGCAGGCA TCACGCCCCT GCAAGTCTTC 
GCCGCGGCTT ACTACTACCA CAAGGGGGTT AAGCTAGTGG AGCTGGAAAA GCTACCCGAG 
ATAACCGCCA TGGTAGAGGC GGCCAGCGGG ATAACGCTGA TGCCGACATA CCCTATTGTT 
GGAGAAAACG CCTTTACGCA CAAGGCCGGG GTACACCAGG CAGGCGTCTT GGCCAACCCC 
GAGACGTACG AGCCGATCCC GCCAGAGGTG GTGGGGAGGA CGCGCGACTT CTCTCTGGAC 
AAGTACAGCG GGAGGAAGGC TATCCAGCAC CGCTTGGAGA AGCTAGGCGT CTCGCTCCAG 
CCTGAGGCCT TGGACAAGGT GGTGGAGGAG GTTAAGAGGA TGAACGCGCC TAGGCTGAGG 
GACGAGGATT TGTTAGAGAT AGTGGAAAAG GTGTCCGGCG TCAGGTACAG GGCTATCGTC 
AACAGGCACA TAGAGGCCTA CATCTGGCTT AAGGTGGCGA ACAACGTGTA CACCACCTCA 
GTGGCGAGGA GGGTCGCCGC CTTGAAAAAC GTCGTGTCGG TCTCCGAAAT AACTGGCGAG 
TACGACATCG TCGTTAAACT TGTGGCGGAG AACACCGAGG AGCTGAACCA GGCGATTGAA 
AGCATAAGGC AGATCAAAGG CGTCGCCTCG ACCTTCACCA GTATTGTGCT GAAGGAGTTG 
CCGACGATCA GCATGCAGAC CAGGGCTTAA

Protein sequence

MLYSWLSFLN SCYLWWHVPG ESRVSILDST LREGEQTPGV VFSEEWRVRI AKALSDIGVG 
MIEVGDPSVA PDIKSAIKKI VKLKKDGEIR SHIVVHSRAV KQDLENAASL EPDRVAVFYG 
VSDLHLKHKH RKTREEALSI IAEMVSFAKS HGVAVRFTAE DASRADLGYL IEVVKTAYEA 
GADRVSIADT VGVFTPDRAR EVFAKVKAAV PGVGLDIHAH NDFGMAVANS LAAVEGGADV 
VHTTVNGLGE RAGITPLQVF AAAYYYHKGV KLVELEKLPE ITAMVEAASG ITLMPTYPIV 
GENAFTHKAG VHQAGVLANP ETYEPIPPEV VGRTRDFSLD KYSGRKAIQH RLEKLGVSLQ 
PEALDKVVEE VKRMNAPRLR DEDLLEIVEK VSGVRYRAIV NRHIEAYIWL KVANNVYTTS 
VARRVAALKN VVSVSEITGE YDIVVKLVAE NTEELNQAIE SIRQIKGVAS TFTSIVLKEL 
PTISMQTRA