Gene Ccel_1854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1854
Symbol
ID	7310577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2204858
End bp	2205937
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	38%
IMG OID	643608785
Product	3-dehydroquinate synthase
Protein accession	YP_002506182
Protein GI	220929273
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0869188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAGAC ATACTATAAA TTTAAAGGAA AGAAGTTATC CAATTTGTAT TGCAACAGAC 
TTTCAGGAAC TTGGGAAAAC GGTTCTATCA TTCAGGCAGG GTAACAAAGC TTTGTTGATA 
ACCGACGAGA ATGTTGATAA TTATTATTCT GATGAGTGTA TGAAAGTACT TCAAGTCAGC 
GGAATAGAGG TTAACAAGCA CGTTCTGAAG CCCGGTGAAA GTAATAAGAC ACTTGAGGCA 
GTTTATGGTA TCTATAATAA GATGGTAGAG TGCAAGCTGG ACAGAAGCAG TATTGTACTG 
GCACTTGGTG GTGGCGTAGT GGGCGATATA GCTGGCTTTG CCGCCGCTAC ATATATGAGA 
GGGATCAACT TTGTTCAGAT ACCTACAACA CTGTTGGCAC AGGCAGATAG CAGCGTTGGA 
GGGAAAACCG GGGTTGATTT CAATGGGCAT AAGAATATTG TGGGTGCATT TTATCAGCCT 
AAAGCAGTGT TTATTAATGT TAATACTATT AAGACACTGC CTAAAAGAGA GATTTCTGCC 
GGTCTTGCAG AGGTAATCAA ACATGGTTTG ATTATGGATG AAGAATACTG TGATTATATT 
AACTATAATG CTGATAAGAT TTTTAAATTT GATGAAAATG TACTGCAATA TCTAGCTAAA 
AAGAATTGTT CAATAAAAGG TTACGTAGTG GAGCAGGACG AAAAAGAGGA CGATTTAAGG 
GCTATTCTTA ACTTTGGACA CACAATCGGT CATGCCATTG AAACGGTTGA GAATTTCAGG 
CTTTTGCATG GTGAATGTGT ATCTATCGGA ATAGTAGGAG TATACAAAAT TGCCCAATAT 
ATGGAAGTTT TGAGTGAGCA ATTAGTTAAT CAGGTTAAAG AAATTCTTTT AAAACTTGGG 
CTTCCTGTTT CCCTGCCTGG TCTGGACGTT GAGAGAGTGT ATAACCAGAT ATTCTACGAT 
AAAAAGGTAA AGGACAACAA GCTAAAGTTT GTTCTGCCTC GTAGAATTGG AGAGGTGTTC 
CAATGTACCA TTAAAGACAA CGAACTGATT AAAAAAGTTC TTTTGGATTT GTCGAATTAA

Protein sequence

MIRHTINLKE RSYPICIATD FQELGKTVLS FRQGNKALLI TDENVDNYYS DECMKVLQVS 
GIEVNKHVLK PGESNKTLEA VYGIYNKMVE CKLDRSSIVL ALGGGVVGDI AGFAAATYMR 
GINFVQIPTT LLAQADSSVG GKTGVDFNGH KNIVGAFYQP KAVFINVNTI KTLPKREISA 
GLAEVIKHGL IMDEEYCDYI NYNADKIFKF DENVLQYLAK KNCSIKGYVV EQDEKEDDLR 
AILNFGHTIG HAIETVENFR LLHGECVSIG IVGVYKIAQY MEVLSEQLVN QVKEILLKLG 
LPVSLPGLDV ERVYNQIFYD KKVKDNKLKF VLPRRIGEVF QCTIKDNELI KKVLLDLSN