Gene Athe_0666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0666
Symbol
ID	7407090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	751628
End bp	753286
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	42%
IMG OID	643715047
Product	acetolactate synthase, large subunit, biosynthetic type
Protein accession	YP_002572563
Protein GI	222528681
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID	[TIGR00118] acetolactate synthase, large subunit, biosynthetic type

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAATTGA CAGGAGCTGA GATTATAATT GAATGTTTAA AAGAACAGGG CGTAAATGTT 
GTTTTTGGTT ATCCGGGTGG TGCTGCTTTA AATATTTATG ATGCTCTTTA CAAACATCAA 
AATGAGATAA AACATTATCT AACATCCCAT GAACAGCACG CATCCCACGC TGCAGACGGA 
TATTCAAGAG CGTCCGGCAA GGTTGGCGTG GTTTTTACTA CCTCAGGACC TGGTGCAACA 
AACATTGTGA CAGGTATTGC AACAGCGTAC ATGGACTCTG TGCCGGTTGT GGCAATCACA 
GGGCAAGTAC CAACTAATTT GCTTGGTAAA GACTCGTTCC AAGAGGTTGA TATTACAGGT 
ATTACCATGC CAATCACAAA GCACAATTTT ATTGTTAAAG ATGTAAATAC ACTTGCAGAC 
ACAATCAGAC GCGCATTTGA GATTGCGCAG AGTGGAAGAC CTGGACCTGT TTTGGTTGAC 
GTTTGCAAAG ATGTGACAGC AGCATATGCT GAATATGAGA AGAAAGAACC TAAAAAGATA 
AAAAAGAAGG TATTAGCAAC AAAAGAAGAG ATAGAAAAGG CAATAGAACT TATCAATGCA 
AGCGAGAGAC CTTTTATCTG CTCAGGTGGC GGTGTTATTT CATCTGAAGC CTCTGAAGAA 
CTTATTGAAT TTGTGGAAAA AATAAACGCA CCTGTTGCAA CAACGCTCAT GGGTGTTGGT 
GGATTTCCTT CTACCCATCC GAACTATACA GGGCTTGTTG GAATGCATGG CACAAGGGCT 
TCTAATTATG CAGTTTCGCA CTGTGACCTT TTGATTGCTG TTGGTGCAAG ATTTTCAGAT 
AGGGTAATCA GCAAGGTTGA CAGGTTTGCA CCAAATGCAA AGATTATTCA CATTGATATT 
GATCCGGCTG AGATTGACAA AAATATAAGC ACAGACATTG CGCTTGTTGG CGATGTAAAG 
CAGATATTAA AAATCTTGGT TGAGAATGTA CAGAAGAAGA CTAACACAGA CTGGATAGAG 
ATGATTTACG AATGGAAGAA AAACTATCCT TTGAGCTATC CTCAAGATGG CAAGCTTCAT 
CCCCAGTATG TTGTTGAGAG AATTTCTGCT CTTACCAACA ACGATGCAAT AATCACAACA 
GAGGTTGGAC AAAACCAGAT TTGGGCAGCA CAATATTACA AATACCAAAG ACCAAGACAA 
TTTATTTCCT CTGGCGGGCT TGGTACAATG GGTTATGGCT TTGGTGCGGC AATTGGAGCA 
AAGATAGCAA AGCCGGACAA AGTAGTCATT GACATTGCAG GTGATGGCAG CTTTAGGATG 
AACTGTGGCG AGCTTGCAAC AGCTGTGCAC TACAATATTC CTGTGATAGT TGCGCTGCTT 
AACAATAGTG TTCTGGGAAT GGTTCGCCAG TGGCAGGACC TTTTCTATGG CAAGAGATTT 
TCACAAACAA CTCTTGACAG GCCGCCTGAT TTTGTCAAGC TTGCAGATGC ATATGGTGCA 
GTTGGCATAA GAGTTACATC GCCAGATGAG GTTGACAGGG CTATTTTAAA AGCGTTAGAG 
GCAGGAAGAC CAACAGTAAT TGACTTTGTA ATTGACAAAG ACGAAAAAGC GCTGCCAATT 
GTCCCACCCG GCGCGCCAAT TGATGAGATT ATAGACTAA

Protein sequence

MKLTGAEIII ECLKEQGVNV VFGYPGGAAL NIYDALYKHQ NEIKHYLTSH EQHASHAADG 
YSRASGKVGV VFTTSGPGAT NIVTGIATAY MDSVPVVAIT GQVPTNLLGK DSFQEVDITG 
ITMPITKHNF IVKDVNTLAD TIRRAFEIAQ SGRPGPVLVD VCKDVTAAYA EYEKKEPKKI 
KKKVLATKEE IEKAIELINA SERPFICSGG GVISSEASEE LIEFVEKINA PVATTLMGVG 
GFPSTHPNYT GLVGMHGTRA SNYAVSHCDL LIAVGARFSD RVISKVDRFA PNAKIIHIDI 
DPAEIDKNIS TDIALVGDVK QILKILVENV QKKTNTDWIE MIYEWKKNYP LSYPQDGKLH 
PQYVVERISA LTNNDAIITT EVGQNQIWAA QYYKYQRPRQ FISSGGLGTM GYGFGAAIGA 
KIAKPDKVVI DIAGDGSFRM NCGELATAVH YNIPVIVALL NNSVLGMVRQ WQDLFYGKRF 
SQTTLDRPPD FVKLADAYGA VGIRVTSPDE VDRAILKALE AGRPTVIDFV IDKDEKALPI 
VPPGAPIDEI ID