Gene Ccel_1618 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1618
Symbol
ID	7310372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	1954778
End bp	1955830
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	32%
IMG OID	643608547
Product	bifunctional 3-deoxy-7-phosphoheptulonate synthase/chorismate mutase
Protein accession	YP_002505950
Protein GI	220929041
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1605] Chorismate mutase [COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase [TIGR01801] chorismate mutase domain of gram positive AroA protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAA GTTTAAAAGC TATAAGACAA GAAATTGATA ATATTAATGA TTCTATCCTT 
GAAATGCTCA ATAAAAGAAC AGAATTAATA AAGGAAATAA CAGATTTAAA AGATCAAAAC 
GGCTCTGAAT ATTTTGATCC TGAACGTGAA ACAGAGATGA TGAAAAAGGT TCTAAGCAAA 
AATAGCGGTC CTTTATATAA CGAGCTTATA AGGGAGGTTT TTAGTGCTAT TTTTTCTACA 
TCACTAAAAT TTATGGGCAT AAGCCGTCAA AAAAAACTGT TGGTAAGTTC AAGTTCGAAT 
GCATGTTTTA AGAGTATTAA TGAAATGTTT GGATTAGGGA ATAATGAACC GGTTATAATT 
GCTGGACCAT GTGCTGTTGA AACGCCAGAA TACCTTGAAA CAATAGCAAA GCACTTAAGA 
GATAAAAATA TCAGATTTAT AAGAGCAGGT GCCTATAAGC CAAGATCATC ACCATATGAC 
TTTCAAGGAT TAAAGGAAAA TGGTTTAAAA ATACTACAAG ACGTTTCTAA ACGCTATGGA 
CTCTTTAGTA TTACGGAAGT TGTTGACACA AGGGACGTAA ACTTAGTAAC ACAGTACGTA 
GATATACTTC AAATTGGTGC AAGAAATATG CAAAATTTTG AACTACTAAA AGAGGTAGGT 
AAAACTAATC ACCCAGTATT ACTAAAAAGA GGTATTAGTG CAACTATCCA AGAATTAATG 
CTTGCGGCAG AGTATATTGC ATTAAAAGGA AATAATAAGA TAATTTTATG TGAGCGTGGA 
ATTAGAACTT ATGAAACAAA AACAAGGAAT ACACTTGATA TTTCTTCAAT ACCTATCATT 
AAAAAAGAAA CACACTTGCC TATTGTAGCT GACATAAGTC ATTCACTTGG AAGAAAAGAT 
ATTGTTAATA ATATTGCAAA AGCTGTTCTT GCAGCAGGTG CTGATGGCAT TATGGTAGAG 
GTGCACCCAA TTCCTGAACT TGCTCTTTCA GATAGTAAAC AACAGCTTAA TTTGAGTGAA 
TTTGACGATA TGCTTGATTT TATAAAAAGA TAA

Protein sequence

MSKSLKAIRQ EIDNINDSIL EMLNKRTELI KEITDLKDQN GSEYFDPERE TEMMKKVLSK 
NSGPLYNELI REVFSAIFST SLKFMGISRQ KKLLVSSSSN ACFKSINEMF GLGNNEPVII 
AGPCAVETPE YLETIAKHLR DKNIRFIRAG AYKPRSSPYD FQGLKENGLK ILQDVSKRYG 
LFSITEVVDT RDVNLVTQYV DILQIGARNM QNFELLKEVG KTNHPVLLKR GISATIQELM 
LAAEYIALKG NNKIILCERG IRTYETKTRN TLDISSIPII KKETHLPIVA DISHSLGRKD 
IVNNIAKAVL AAGADGIMVE VHPIPELALS DSKQQLNLSE FDDMLDFIKR