Gene Pars_2063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2063
Symbol	aksA
ID	5056297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1844745
End bp	1845914
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	55%
IMG OID	640469612
Product	trans-homoaconitate synthase
Protein accession	YP_001154261
Protein GI	145592259
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR02090] isopropylmalate/citramalate/homocitrate synthases

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.214289
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGTTGT CCGCCTATGG CTTCGGGGCT CGTACAATAA GGATATTCGA CACAACTCTC 
AGAGACGGCG AGCAGATGCC CGGCGTCGCC TTGTCACCTT CTGAAAAGTT GCAAATCGCC 
CTAGCTCTAG ACGAGGCAGG TGTAGACATG ATAGAGGCGG GTTTTGCCGC GGTCTCAAAA 
GACGAACAGA TGGCCATTAG GCAGATCTCT AAAGAAGTGG CGACAGCCAA GGTGGTTAGC 
CTTGCCCGCA TGGCGAAATC TGACGTCGAC GCGGCTCTCG ATGCCGATGT GGATATGATC 
CACTTGTTCA TTGCCACGTC TGATATACAC CTGAAGTATA AGCTTGGCAT TACGAGGGAG 
GAGGCCATTA GGCGGATAGA GGAGGTGGTC TCATACGCCA AATCGCACGG GGTCGACATA 
TTGTTCAGTG CAGAAGACGC CACAAGGAGC GACCTAGATT TCCTGGTGGA GGCTTATAAG 
ACAGCTATCA GCGCCGGCGC CGACGAGATC AACGTCCCAG ACACGGTGGG TGTGATGACC 
CCTAGCCGGA TGGTCTATCT TATAGGCTAC CTAAAGCAGA GGCTCCCCCC GGTGCCTATG 
CACGTCCACT GCCACGACGA CTTCGGCATG GCTGTGGCCA ATACAGTAAC CGCCATAGAA 
AACGGCGCCG ACGTGGCGCA GGTGGTTGTT AACAACTTCG GCGAGAGGGC CGGCAACGCG 
GCGCTGGAAG AGGTAGTAGC CGCAGTGCAC TACCTGCTTG GCTACAAGAC AAATATCAAG 
TTGGAGAAAC TCTACGAGCT GTCGCAGTTA GTGTCTAAAC TATTCGGCAT CCCCGTGCCG 
CCGAATAAGG CGGTGGTGGG GGAAAACGCC TTCAGCCACG AGGCCGGCAT CCACGTACAC 
GGCGTTTTGA ACAACCCATT CACCTACGAG CCTATGAGGC CTGAAGACGT GGGCAATCGG 
CGCAGGATAG TCCTCGGAAA GCATTCGGGG AGACACGCGG TGGTGTGGGC TTTGAAGAAC 
ATAGGCGTCG AGCCCACAGA CGACTTGGTG GACTACGTCT TAAACGCCGT GAAGGAGCTG 
GCTGTGAGGA AAGTAAAGGT GGACGAGTCT GTTCTTAGGC AAGTCGTAAA TGATTATAGG 
AGGGGGGTAT TTGTACCCTA TGCCGTATAA

Protein sequence

MKLSAYGFGA RTIRIFDTTL RDGEQMPGVA LSPSEKLQIA LALDEAGVDM IEAGFAAVSK 
DEQMAIRQIS KEVATAKVVS LARMAKSDVD AALDADVDMI HLFIATSDIH LKYKLGITRE 
EAIRRIEEVV SYAKSHGVDI LFSAEDATRS DLDFLVEAYK TAISAGADEI NVPDTVGVMT 
PSRMVYLIGY LKQRLPPVPM HVHCHDDFGM AVANTVTAIE NGADVAQVVV NNFGERAGNA 
ALEEVVAAVH YLLGYKTNIK LEKLYELSQL VSKLFGIPVP PNKAVVGENA FSHEAGIHVH 
GVLNNPFTYE PMRPEDVGNR RRIVLGKHSG RHAVVWALKN IGVEPTDDLV DYVLNAVKEL 
AVRKVKVDES VLRQVVNDYR RGVFVPYAV