Gene Ccel_2004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2004
Symbol
ID	7310714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2366423
End bp	2367685
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	42%
IMG OID	643608938
Product	3,4-dihydroxy-2-butanone 4-phosphate synthase
Protein accession	YP_002506331
Protein GI	220929422
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II [TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.012993
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTTA GTTCAATAGA AGAAGCAATA GAGGATATCC GCCAAGGTAA AATTATTATA 
GTAGTAGATG ATGAGGACAG GGAGAACGAG GGAGACCTTC TTATGGCTGC CGAAAAGGCT 
ACTCCCGAAA GCATAAATTT TATGGCTACC TATGGTAAGG GCATGATATG CGTTCCTCTG 
ACATCAGCTA GAGCGGGAGA GTTGGAACTT TTCCCCATGG TAAGTCACAA TGAGGACCGT 
CATGGTACGG CGTTTACGGT AACTGTGGAT CACAGAGATT CTACAACAGG TATTTCAGCT 
TTCGAAAGAG CACATACAAT AGTTGAGCTT ACTAATAAAA AAGCACATCC GGGCGATTTT 
AAAAGGCCGG GGCATGTATT TCCTCTTACT GCAAGGGACG GAGGAGTTCT TAAGCGTACA 
GGACACACTG AAGCCGCAGT TGATCTGGCC CGTATGGCTG GTCTGTATCC CGCTGGTGTA 
ATATGTGAAA TAATGAATGA TGACGGAAGG ATGGCAAGGG TTCCACAATT AATGGAGTTT 
TCCCAAAAGC ATGGCTTAAA GATAATAACG GTAGCAGGTC TTATTGAATA TCGCAGAAAA 
AATGAAAAGT TGATTAAAAG AGCTGCGGAA GCAAAAATGC CCACTGCTTA TGGAGAATTT 
AAAATAATTG GTTATGAGAA TACTACCAAT GGGGAGCACC ATGTAGCACT TGTCAAGGGA 
GATGTAGCAG GCTCAACAGA CCCTGTTCTG GTCAGAGTAC ATTCCGAATG TCTCACAGGT 
GATGCTTTTC ATTCACAAAG GTGTGACTGC GGAGAACAGC TTGAAGCCGC ATTGAGCAGA 
ATCAACAATG AAGGAAAAGG GGTTTTGCTT TATATGCGTC AGGAGGGAAG GGGCATCGGT 
CTGATAAATA AAATACGTGC ATATGAGCTT CAAGACCAAG GTATGGATAC TGTCGAAGCA 
AATATAAAGC TGGGCTTTCC GGCAGATTTG AGAGAATACG GCATAGGTGC TCAAATCTTG 
TACGATTTAG GAATAAAGAA AATAAAGCTG CTGACTAACA ACCCCAAAAA ACTGGTTGGG 
CTAAATGGGT ATGGTCTGGA GGTAGTCGGA CGAGAATCTA TTCAAATAAA AGAAAATGAA 
AAAAATGAAT TTTATCTGAG AACAAAAAAG GAAAAAATGG GCCACTTGTT TGATGGTCTG 
AACAATAAAA CAAGCGAGAA AAATACAACA GCACATCAGG AGGAAAATAA AAATGTCGAT 
TAA

Protein sequence

MNFSSIEEAI EDIRQGKIII VVDDEDRENE GDLLMAAEKA TPESINFMAT YGKGMICVPL 
TSARAGELEL FPMVSHNEDR HGTAFTVTVD HRDSTTGISA FERAHTIVEL TNKKAHPGDF 
KRPGHVFPLT ARDGGVLKRT GHTEAAVDLA RMAGLYPAGV ICEIMNDDGR MARVPQLMEF 
SQKHGLKIIT VAGLIEYRRK NEKLIKRAAE AKMPTAYGEF KIIGYENTTN GEHHVALVKG 
DVAGSTDPVL VRVHSECLTG DAFHSQRCDC GEQLEAALSR INNEGKGVLL YMRQEGRGIG 
LINKIRAYEL QDQGMDTVEA NIKLGFPADL REYGIGAQIL YDLGIKKIKL LTNNPKKLVG 
LNGYGLEVVG RESIQIKENE KNEFYLRTKK EKMGHLFDGL NNKTSEKNTT AHQEENKNVD