Gene Athe_0505 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0505
Symbol
ID	7408629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	574668
End bp	576191
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	40%
IMG OID	643714887
Product	2-isopropylmalate synthase
Protein accession	YP_002572404
Protein GI	222528522
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00973] 2-isopropylmalate synthase, bacterial type

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAAA GAGTTATTAG AATATTTGAT ACCACGCTCA GAGACGGTGA GCAAACACCA 
GGTGTGTCGC TCAACGTCAA TGAAAAACTT GAGATTGCAA AACAGCTTGA AAAACTCAAA 
GTTGATGTGA TAGAAGCAGG ATTTGCAATT GCCTCTCCTG GGGATTTTGA GGCAATAAAA 
GTAATATCTG AGAATATAAA GGATGCAGTA ATAGTCTCTT TGGCAAGAGC AATTGAAAAA 
GACATAGATA GGGCGTATGA GGCGCTCAAA AAGGCTTCAT CCCCAAGAAT TCATACATTC 
ATTGCAACAA GTGATATTCA TATGAAATAC AAGCTCAAGA TGACAGAAGA TGAGGTACTT 
GAGCGAGCAG TTGCTATGGT AAAATATGCA AAAAAATATG TGTCTGATGT AGAGTTTTCA 
TGTGAGGATG CAACACGTTC AAGAATTGAA TTTTTAATAA AGGTGTTTGA CGCTGTAATA 
AAAGCCGGTG CAACAGTTAT AAACATACCA GACACGGTAG GCTACACAAC ACCTGAAGAG 
ATGAAAAGAA TTATTCGAGC AATAAAAGAA AACATTCCTG ACATTGACAA GGTTCAAATT 
TCAGTTCATT GCCACAACGA CTTAGGTCTT GCTGTTGCAA ACTCATTGGC TGCTGTTGAA 
GAAGGGGTTC ATCAGGTTGA ATGTACAATA AATGGTCTTG GTGAGAGGGC TGGGAATGCT 
GCCTTAGAAG AAATTGTAAT GGCTCTCAAA ACCCGAAAAG ACTTTTATGA TGTTGATGTT 
TTGATAGATA CAACCCAGAT TTATCGAACA AGCAAGCTTG TGTCTTCTCT TACAGGCGTA 
TTTGTTCAGC CAAACAAAGC AATAGTTGGT GCAAATGCAT TTGCGCACGA GTCTGGTATA 
CATCAGCATG GAGTATTGTC AGAACGAACA ACATATGAGA TTATTGACCC TGTGTCAATT 
GGTCTTCCGA AAAACAGGAT GGTTTTGGGC AAGCACTCTG GTCGTCATGC GTTTGAAGAA 
AGGCTCAAAG AGCTTGGATA CACAGACCTC ACAAGAGAAG AGATTGACGC TGCATTTGAA 
AAGTTTAAAG TTTTGGCAGA CAAAAAGAAG GTTGTACTTG ACAAAGACAT TGAGGCACTT 
TTAGAACAAA AGTCACTCAA TATTCCAGAG ACATATGAGC TTGTAAGGTT CCAGATAATA 
AGCGGAAATG GTCTTATATC AACTGCATCT GTAAGGATAA AATCGGGTGA GGAAGAGTTT 
GAAGAGGCGG CGACAGGTGA TGGTCCTGTT GATGCAATCT TCAAGGCAAT TGACAGAATT 
ACAGGTCTTC AGGTTGAACT TGATGATTAT AGTATAAAGG CTGTCACCCA GGGCAAGGAT 
GCTCTTGGCG AGGTAACAGT CAGAATTAAG AAGGATGGCA AAGCGTTTTT GGGAAGAGGC 
TTATCTACAG ATATTTTAGA AGCAAGCGCA AAAGCGTATG TAAATGCTAT AAATAAGATG 
CTGTATAAAA TTTCAGAGGA GTAA

Protein sequence

MGKRVIRIFD TTLRDGEQTP GVSLNVNEKL EIAKQLEKLK VDVIEAGFAI ASPGDFEAIK 
VISENIKDAV IVSLARAIEK DIDRAYEALK KASSPRIHTF IATSDIHMKY KLKMTEDEVL 
ERAVAMVKYA KKYVSDVEFS CEDATRSRIE FLIKVFDAVI KAGATVINIP DTVGYTTPEE 
MKRIIRAIKE NIPDIDKVQI SVHCHNDLGL AVANSLAAVE EGVHQVECTI NGLGERAGNA 
ALEEIVMALK TRKDFYDVDV LIDTTQIYRT SKLVSSLTGV FVQPNKAIVG ANAFAHESGI 
HQHGVLSERT TYEIIDPVSI GLPKNRMVLG KHSGRHAFEE RLKELGYTDL TREEIDAAFE 
KFKVLADKKK VVLDKDIEAL LEQKSLNIPE TYELVRFQII SGNGLISTAS VRIKSGEEEF 
EEAATGDGPV DAIFKAIDRI TGLQVELDDY SIKAVTQGKD ALGEVTVRIK KDGKAFLGRG 
LSTDILEASA KAYVNAINKM LYKISEE