Gene Mpal_0185 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_0185
Symbol
ID	7270956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	215437
End bp	216696
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	60%
IMG OID	643568840
Product	homoaconitate hydratase family protein
Protein accession	YP_002465297
Protein GI	219850865
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.576372
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0771341
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCAA TGGGAGCAAC AATAGCGGAG AAGATATTCT CAACCCGATG CGGAAGGCCG 
GTCCACGCAG GTGACGTGGT GATGGCTCCG ATAGATGCAG CGATGATCCA TGATATCACA 
GGCCCGCTTG CCATTCAGAC TTTTTACCAG ATGGGTGGCA CCAGGGTTTT TGACCCAAAG 
AAGGTGATCA TGCTCTTTGA TCATCAGATC CCTGCAGACT CCATTGCAGC AGCAGGAAAC 
CATCAACTGA TGCGAAAGTT TGCAGCAGAA CAGGGGATCC ACAACTATGA CCTCCACGAG 
GGGGTCTGCC ATCAGGTGGT TCTTGAAAAG GGAAGGGCTG GGCCTGGTGA GATCGTGGTC 
GGGTCCGACT CGCACACCTG CATGTATGGT GCCGCAGGGG CGTTTGCAAC CGGAATAGGG 
TCGACCGATA TGGGTTTTGT CCTGAAGTTC GGGGCCCTCT ACTTCCGGGT GCCCGAGACG 
ATCAGGATGA CTATCGACGG TGCCTTCCAG CGCCGGGTCG GTCCCAAGGA TCTGATCCTC 
TCGATCATCG GGGATATCGG TGCTGACGGG GCCACCTATA AGGCGGTGGA GTTTGCAGGG 
TCGACGATCC GGGGGATGGA GATGCCTGGG CGGATGACTC TTTCGAATAT GGCCATCGAG 
ATGGGGGGCA AGGCCGGGAT CGTCCCGCCT GATCAGGTGA CCTGGGATTA CCTGAAGTCA 
AGGCGGCAGG TCACGCCGTT TGAACTGGAC AGTGACGAGG ACGCGACCTT TGCCGATCAG 
CGACGGTATG ATGTGACGAA CCTTGTACCC AAAGTCGCCG TCCCGCACAA CGTGGACCAC 
GTGGTCGACG TGACTGAAGT GGCAGGGACG CACCTCGACC AGGTTTTCAT CGGATCGTGC 
ACCAACGGGC GGTTCGAGGA TCTTGCAGAG GCCGCGGCCG TCCTCGGCGA TCGGAATTTC 
TCCGAGGATC TCCGTGTGCT CGTCATCCCG GCATCAAGGG ATGAATACTT GAAGACGCTG 
CGGGCCGGGC TGATCGAGCG GTTCGTCGAG GCCGGGGCGA TGGTCGAGGC GCCGTGCTGC 
GGGCCGTGTA TGGGCGGATC GTTCGGGCTG ATCGGCCCGG GCGAGGCTTC TCTCTCCACC 
TCGAACCGGA ACTTTAGGGG CCGGCAGGGG TCGGCCGAGG GATCGGTGTA CCTGGCCTCG 
GCGGCGACGG CTGCAGCGAG TGCGATCACC GGTGTGATCA CCGATCCGAG GGAGGTGTGA

Protein sequence

MNAMGATIAE KIFSTRCGRP VHAGDVVMAP IDAAMIHDIT GPLAIQTFYQ MGGTRVFDPK 
KVIMLFDHQI PADSIAAAGN HQLMRKFAAE QGIHNYDLHE GVCHQVVLEK GRAGPGEIVV 
GSDSHTCMYG AAGAFATGIG STDMGFVLKF GALYFRVPET IRMTIDGAFQ RRVGPKDLIL 
SIIGDIGADG ATYKAVEFAG STIRGMEMPG RMTLSNMAIE MGGKAGIVPP DQVTWDYLKS 
RRQVTPFELD SDEDATFADQ RRYDVTNLVP KVAVPHNVDH VVDVTEVAGT HLDQVFIGSC 
TNGRFEDLAE AAAVLGDRNF SEDLRVLVIP ASRDEYLKTL RAGLIERFVE AGAMVEAPCC 
GPCMGGSFGL IGPGEASLST SNRNFRGRQG SAEGSVYLAS AATAAASAIT GVITDPREV