Gene Athe_1808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1808
Symbol
ID	7408595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1882950
End bp	1883996
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	38%
IMG OID	643716185
Product	1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase
Protein accession	YP_002573674
Protein GI	222529792
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.59435
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAATTAT TGACAAAAAA GGTTAGAATA GGCAATCTTT ATATTGGTGG CGGTGAGCCA 
ATTAGAATTC AGTCAATGAC AAATACAAAG ACAAAGGATG TTGAGGCTAC AGTTGAGCAG 
ATACTGAGCC TTGAGAGTTT GGGATGCGAC ATCATAAGAG TTGCTGTCCC TGATTTAGAT 
AGTGCTAAGG CCATAAGTAA AATAAAGTCA AGAATCCACA TTCCACTTGT TGCTGACATT 
CATTTTGACT ATAAGCTCGC GCTTGAAGCT ATATACAATG GCGCTGATAA GATTAGAATA 
AATCCTGGGA ACATTGGAAA TGAAAGAAAA GTCCAAGAAA TAGCTAAAGA GGCCAAAAGA 
TATGGGATTG CCGTCAGAGT TGGTGCAAAT TCAGGTTCGC TCCCAAAGGA TATTTTGCAA 
AAATACAAAT CTCCTGTACC AGAGGCTATT GTGGAGGCTG CAATTTATCA GGTAAAACTT 
CTTGAAAAGT TTGACTTTGA CAATATTGTT GTGTCTGTCA AATCTTCAGA TGTTTTAACT 
ACAATTAAGA GCTATGAAAT ACTATCCCAA AACCTAAACT ATCCTCTTCA TGTTGGTCTT 
ACCGAAGCAG GAACTTTTGT TGCAGGAACT GTTAAGTCAA GTATTGCAAT TGGCTATCTT 
CTTTTGAGGG GAATTGGTGA TACAATAAGA GTTTCTCTTA CAGATAGTCC AGAGAAAGAG 
GTTATTGTGG CAAAAGAGAT TTTAAAAAGT TTAAATCTCA GAAAAGGTGT GAAGATAGTA 
TCATGTCCCA CCTGTGCAAG ATGTAATGTT GACCTTTTAA AGATTGCAGA TGAGGTTGAA 
AAGAGAATAC AAAATTTGGA CTTGGACATT ACAGTCGCAA TAATGGGCTG TGCAGTAAAC 
GGCCCTGGTG AGGCAAAAGA AGCTGATGTA GGTGTGGCAT GTGGCGTTGG TGAAGGACTT 
CTGTTTAAGA AAGGCAAGAT TATAAGGAAA GTGAAAGAGA ATGAGATTGT AGATGAGCTT 
GTAAAGGAAA TCTATTCTCT TTCTTAA

Protein sequence

MKLLTKKVRI GNLYIGGGEP IRIQSMTNTK TKDVEATVEQ ILSLESLGCD IIRVAVPDLD 
SAKAISKIKS RIHIPLVADI HFDYKLALEA IYNGADKIRI NPGNIGNERK VQEIAKEAKR 
YGIAVRVGAN SGSLPKDILQ KYKSPVPEAI VEAAIYQVKL LEKFDFDNIV VSVKSSDVLT 
TIKSYEILSQ NLNYPLHVGL TEAGTFVAGT VKSSIAIGYL LLRGIGDTIR VSLTDSPEKE 
VIVAKEILKS LNLRKGVKIV SCPTCARCNV DLLKIADEVE KRIQNLDLDI TVAIMGCAVN 
GPGEAKEADV GVACGVGEGL LFKKGKIIRK VKENEIVDEL VKEIYSLS