Gene Mthe_1533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1533
Symbol	aksA
ID	4461720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	1660269
End bp	1661450
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	53%
IMG OID	639700556
Product	trans-homoaconitate synthase
Protein accession	YP_843945
Protein GI	116754827
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.200545
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACT TCTCCGTCAA TCAGTTTCTT GAGATGGCCG GCACCCCTCC TCTGGATATA 
GAGATATGCG ATGTAACGCT TAGGGACGGC GAGCAGATGC CGGGGGTTGT GTTCAAGCCC 
GAGGAGAAGC TTGAGATCGC TAGGAGGCTC GACGAGATCG GCGTCGAGAT CATAGAGGCC 
GGATTTCCAG TTGTATCAAA GAGCGAAAAG AACGCGGTGA GAGATATCTG CAATCTCGGC 
CTGAATGCGA AGATATCCGC TCTCTCCAGG TCCAGGCAGT CTGATGTCGA TGTGGCGATC 
GATTGCGGTG TTGATATGGT GAGCGTATTC ATAGCGACCT CAGATCTCCA TCTGAAATAC 
AAGCTGCATA TGACATGCGC AGAGGCGATA AGGTGTGCGC TGGAGACTGT TGAGTATGCA 
AAGGAGCATG GTCTCATAGT CAGGTTCTCG GCTGAGGATG CGACGCGAAC GGATTTCAAC 
ACGCTCAAGA AGCTCTACAA AAAAGCAGAG GAGTACCACG CAGATTACGT GAGCGTGGCC 
GACACAGTCG GCATAATGAA CCCGAGGACG ATGTACTACA TGATCAGCGA GATCAAGAAG 
ATTGTGAACA TTCCGATATG TGTTCACTGT CACGATGATC TCGGTCTCGC GCTGGCGAAC 
ACCCTTGCCG GAGCAGAGGC GGGCGCGAAG CAGCTCCACA CCACCGTCAA CGGCATCGGC 
GAGAGGAGCG GAAACACGCC GCTTGAGGAG CTGCTGGTCA ACCTTCGCCT ACACTACGGC 
ATAGATCGCT ACGATCTGAG CAAACTCAAG TCGATCTCCT CTCTGGTGGA GAGATATTCG 
GGCGTACCTG TTGCAAAGAA CAAGGCTGTT GTTGGAGATA ATGCCTTTGC GCACGAATCC 
GGGATCCATG TCGCCGCGGT CCTCGAGGAG CCCAGGACCT ATGAGCTCTA CTCCCCTGAG 
ATGGTGGGGG CTGAGAGGAG GATCATCATC GGGAAGCACA CAGGAGCCAA GGCGCTCAAG 
TACATCACGA AGAAGATGGG CTATGACCTG GAGAAAAAGG ATCTCTGCCT CCTTGCTGAG 
AAGGTGAAGA CCGCGAGCGA GTTCAAGAGA CCGATAACAT GCGATGAGTT GAGAAGACTG 
ATCCTCGATC TCAAAATAGA GTTTGTGTAC AACGGTCCGT AG

Protein sequence

MSDFSVNQFL EMAGTPPLDI EICDVTLRDG EQMPGVVFKP EEKLEIARRL DEIGVEIIEA 
GFPVVSKSEK NAVRDICNLG LNAKISALSR SRQSDVDVAI DCGVDMVSVF IATSDLHLKY 
KLHMTCAEAI RCALETVEYA KEHGLIVRFS AEDATRTDFN TLKKLYKKAE EYHADYVSVA 
DTVGIMNPRT MYYMISEIKK IVNIPICVHC HDDLGLALAN TLAGAEAGAK QLHTTVNGIG 
ERSGNTPLEE LLVNLRLHYG IDRYDLSKLK SISSLVERYS GVPVAKNKAV VGDNAFAHES 
GIHVAAVLEE PRTYELYSPE MVGAERRIII GKHTGAKALK YITKKMGYDL EKKDLCLLAE 
KVKTASEFKR PITCDELRRL ILDLKIEFVY NGP