Gene Athe_2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2101
Symbol
ID	7408810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2226557
End bp	2227846
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	39%
IMG OID	643716467
Product	3-isopropylmalate dehydratase large subunit
Protein accession	YP_002573950
Protein GI	222530068
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02083] 3-isopropylmalate dehydratase, large subunit [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0493977
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAAC CGATGACAAT GTCACAAAAG ATTTTGGCAT ACCATGCAGG AAAAGAATAT 
GTTGAACCTG GAGACTTGAT TTTTGCAAAT GTTGACCTTG TTTTGGGGAA TGACGTTACA 
ACACCTGTTG CAATAAAGGA GTTTGAAAAG ATAGGGATTG ACAGGGTTTT TGACAAAGAT 
AAAATTGCGA TAGTTCCCGA CCATTTTACT CCAAACAAAG ACATAAAGTC TGCTCAGCAG 
TGCAAGATGG TTCGAGAGTT TGCTAAAAAG TATGAGATTA CAAATTATTT TGAAGTTGGC 
GAGATGGGTA TTGAACATGC ACTCTTGCCA GAAAAAGGAC TTGTTGTGCC GGGTGATTTG 
GTAATTGGTG CGGATTCGCA TACTTGCACA TATGGTGCAC TTGGTGCTTT TTCAACAGGA 
ATTGGTTCTA CTGACATGGC ATGTGCAATG GCAACAGGAA AGTGCTGGTT CAAAGTTCCA 
GAGGCCATTA AATTTATTCT CTACGGCAAA AAAACTGGCT GGACATCGGG AAAAGATATC 
ATCCTTCACA TTATTGGTAT GATAGGTGTT GATGGTGCAC TTTACAAGTC AATGGAATAC 
ACGGGAGAAG GTTTAAAATC ACTTTCAATG GATGACAGGT TCACCATTGC TAACATGGCA 
ATTGAAGCAG GTGCGAAAAA TGGCATATTT GAGGTTGATG AAAAGACAAT AGAGTATGTA 
AAACAGCACT CTACAAAGCC TTATAAGATA TTCAAGGCAG ACGAGGATGC AGAGTATTCA 
CAGGTCTTTG AGATTGATAT TTCAAAAATT AGACCCACAG TTGCCTTTCC ACATCTTCCA 
GAGAATACAA AGACGATTGA TGAGATAACA GAAAAGATTT ATATTGACCA GGTTGTGATT 
GGTTCTTGCA CAAATGGCAG AATTGAAGAC TTAAGGATTG CAGCAAAGAT CTTAAAAGGA 
AGAAAGGTTA AAAAAGGGCT CAGATGTATT ATATTCCCTG CAACACAGAA TATATACAAA 
CAGGCATTAA AAGAGGGATT CATTGAGATA TTCATAGACG CTGGATGTGT TGTTTCAACA 
CCAACTTGTG GTCCATGCCT TGGTGGACAC ATGGGAATTT TAGCAGATGG TGAGAAGGCT 
CTTGCTACAA CAAATAGGAA CTTTGTTGGC AGAATGGGTC ATCCAAATAG TGAGGTTTAT 
CTTTCATCGC CTGCAATTGC AGCAGCATCA GCAGTTTTAG GTTACATTGG CTCACCTGAA 
GAGCTTGGAA TGAAAGGAGA TGAAGAATAG

Protein sequence

MTKPMTMSQK ILAYHAGKEY VEPGDLIFAN VDLVLGNDVT TPVAIKEFEK IGIDRVFDKD 
KIAIVPDHFT PNKDIKSAQQ CKMVREFAKK YEITNYFEVG EMGIEHALLP EKGLVVPGDL 
VIGADSHTCT YGALGAFSTG IGSTDMACAM ATGKCWFKVP EAIKFILYGK KTGWTSGKDI 
ILHIIGMIGV DGALYKSMEY TGEGLKSLSM DDRFTIANMA IEAGAKNGIF EVDEKTIEYV 
KQHSTKPYKI FKADEDAEYS QVFEIDISKI RPTVAFPHLP ENTKTIDEIT EKIYIDQVVI 
GSCTNGRIED LRIAAKILKG RKVKKGLRCI IFPATQNIYK QALKEGFIEI FIDAGCVVST 
PTCGPCLGGH MGILADGEKA LATTNRNFVG RMGHPNSEVY LSSPAIAAAS AVLGYIGSPE 
ELGMKGDEE