Gene Ccel_3449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3449
Symbol
ID	7312008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	4013905
End bp	4014945
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	44%
IMG OID	643610358
Product	Transketolase domain protein
Protein accession	YP_002507717
Protein GI	220930808
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTGGA CTACAATAGA AGTTGAAAAA CAGGACAATT TTGTAATAAC TGATGATTCG 
GAAATTGGCA GAATGATTTC ATATAAGGAT GCGTTGTACG AAGCATTGGA CCAGTCTCTT 
GCTAGAGACC CAAGAGTTTT TATTATGGGA GAGGGTGTTG ATGACCCCGG CGGAGTTTTT 
GGGACTACGA AAGGCCTCCA TGAAAAATAC GGCCGAAATA GAGTTTTTGA CACGCCAATT 
GCAGAAAACT CTCTGACAGG TATTGCTGCT GGAGCCGCAA TGGCAGGGTT AAGACCGATT 
TTTGTGCATA GTAGAATGGA CTTTTTGCTG CTTTCGTTGG ATCAGCTGGT AAACCATGCC 
GCAAAGTGGA GCTATATGAC GGGAGGAAAG GTCAAAGTTC CTTTAGTGGT AAGAACGGTG 
AGTGCAAGAG GATGGGGATC GGGAGCACAA CATTCACAAT GTCTGCATGG AATGCTTATG 
AATGCCCCCG GACTAAAAAT AGCTGTGCCT GCCACTCCCT ATGATGCCAA GGGATTGTTA 
ATATCAAGCA TAATAGACAA TAATCCTGTC CTGTTCGTGG AACACAGATG GCTCTACAAA 
ACAGTAGGTA ATGTCCCGGA TACACTGTAT TCCATACCTT TCGGTAAGGG TGCTGTAAGA 
AGAAAGGGAA AGGATATTAC TATAGTTGCA GTATCTTATA TGCTGGTTGA GGCTCTAAAG 
GCAGCCGAGA AGCTTCAAGC TAAGAACATA TCGGCAGAGG TCATAGATTT AAGGACAATA 
AAACCGATAG ACGAGGACAT TATCTTTGAA TCCCTTGCAA AGACCGGTAG GCTTATAGTA 
ACAGACACGG GATGGAAGAC CGGCGGGGCC GCCGCAGAAA TAACAGCCCT TGTTGCTGAA 
AAGGCTGTTC ATCTTCTTAA AAAGCCTGTA GTAAGGGTTT GCTGCCCTGA TATACCTACC 
CCGACGGGAG ATTTGCAGGA GAAAGCCTTT TATCCTGATT CTGAAAGTAT ATGCGACAAG 
GCTGTTGAAT TAATGAAGTA A

Protein sequence

MPWTTIEVEK QDNFVITDDS EIGRMISYKD ALYEALDQSL ARDPRVFIMG EGVDDPGGVF 
GTTKGLHEKY GRNRVFDTPI AENSLTGIAA GAAMAGLRPI FVHSRMDFLL LSLDQLVNHA 
AKWSYMTGGK VKVPLVVRTV SARGWGSGAQ HSQCLHGMLM NAPGLKIAVP ATPYDAKGLL 
ISSIIDNNPV LFVEHRWLYK TVGNVPDTLY SIPFGKGAVR RKGKDITIVA VSYMLVEALK 
AAEKLQAKNI SAEVIDLRTI KPIDEDIIFE SLAKTGRLIV TDTGWKTGGA AAEITALVAE 
KAVHLLKKPV VRVCCPDIPT PTGDLQEKAF YPDSESICDK AVELMK