Gene Mpal_2143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_2143
Symbol
ID	7271623
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	2277686
End bp	2278906
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	65%
IMG OID	643570757
Product	3-isopropylmalate dehydratase
Protein accession	YP_002467164
Protein GI	219852732
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACGC TCGCTGAACG GATTCTGGGC GGAGCGGCCG GCACCTACCT GGACCGAAAG 
ATCGATACCG CGTATGCCCA TGACGGGACC GGAGTCCTGA CCCTTCAGGC CTGGGAGGAG 
ATGGGGGGTG GCATACCAGC CCATCCCGAG CGGTTACAGA TCCTCTTCGA CCACATCGTC 
CCTGCCAACA ACAGCACCAC CGCCACCCTC CAGCAGAAAC TCCGGGCGTT CTCAAAGGGT 
GCCGGTATCC GCTTCTCCGA CTGCGGGGAA GGGATCTGCC ACCAGGTGCT CGCCGAAGGA 
GGGATCATCC CTGGAAACGT GGTGATCGGG GCCGACTCGC ACACCTGCAC GCTCGGGGCG 
TTCGGCGCCT TTGCCACAGG TGTCGGGGCG ACCGACATGG CTGCAATCTG GGCATCGGGG 
TGCATCTGGC TGAAGGTTCC CGAGACGATC AGGGTCGACC TTCAGGGGAG GCTGACTGGC 
GCTGCCGAGC CCAAAGACCT GGCCCTCCGA TACGTCTCGC TCCTCGGGAT GGGCGGGGCC 
ACCTACAAAG CCCTGGAGTT CACCGGGGAG GGGGCGGCCA CGATCCCGAT GGATGGAAGG 
CTGACGATGG CCAACCTCGC CGTCGAGACC GGTGCCAAGG CCGGCCTCTT CTACGCGGAC 
CAGGAGACCA GGCGATACCT GGCGGCATCT GGAAAAGATG TCGATGATGC GATCACCCAG 
GTCCCTGAGG AGGGAAAATA CCTGGAGACC CTGGCGATCG ATCTCGCTGA TATCGAGCCG 
CTGGTCGCCG TCCCCCACCG GGTCGACACA GTCCGACCGG TCGCCGACGT CGCCGGGCTC 
CATCTGGATC AGGTCTTCCT CGGCACCTGT ACCAACGGTC GGTACCCCGA TCTGGCCAGG 
TTCGCTGCGA TCGTGAAGGG GAAGAAGGTC GTCGTCCGGA CGGTGATCGT CCCGGCCTCG 
CAGAAGGTGC TCATCGAGGC TGCCTCCACC GGCGTGCTCG CAGACCTGAT CGGTGCCGGC 
TGCATGGTCG GTCCGCCAGG ATGCGGCCCC TGCCTCGGGG CTCATCTGGG GGTGATCGGA 
GAAGGGGAGG TCTGCCTCTC AACGGCCAAC AGGAACTTCC TCAACCGGAT GGGGGTCGGG 
GGATCGATCT ACCTCTCCTC GGTCAGCACA GCTGCGGCGA GTGCCCTCAC CGGCGAGATC 
ACCAGTCCGG AGGGGATCTG A

Protein sequence

MSTLAERILG GAAGTYLDRK IDTAYAHDGT GVLTLQAWEE MGGGIPAHPE RLQILFDHIV 
PANNSTTATL QQKLRAFSKG AGIRFSDCGE GICHQVLAEG GIIPGNVVIG ADSHTCTLGA 
FGAFATGVGA TDMAAIWASG CIWLKVPETI RVDLQGRLTG AAEPKDLALR YVSLLGMGGA 
TYKALEFTGE GAATIPMDGR LTMANLAVET GAKAGLFYAD QETRRYLAAS GKDVDDAITQ 
VPEEGKYLET LAIDLADIEP LVAVPHRVDT VRPVADVAGL HLDQVFLGTC TNGRYPDLAR 
FAAIVKGKKV VVRTVIVPAS QKVLIEAAST GVLADLIGAG CMVGPPGCGP CLGAHLGVIG 
EGEVCLSTAN RNFLNRMGVG GSIYLSSVST AAASALTGEI TSPEGI