Gene Cthe_1086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1086
Symbol
ID	4811384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	1293343
End bp	1294329
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	40%
IMG OID	640106508
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001037511
Protein GI	125973601
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.889547
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAA TGCTTGTTAC AGGCGGAGCA GGTTTTGTAG GAAGCAACTT TATACGCTTT 
TTTCTCAGAA GAAACAAAAA TTTTATTATC ATAAACATGG ATAATTTAAG CTCCACATCA 
AACCTGGAAA ACGTAAAAGA TTTGGAAAAG TCGCCCCGAT ACCATTTTGT AAAGGGCAGT 
ATAACAAACC ATGAACTTGT AAACTATGTT ATTAAAAGGC ATAGACCCGA CTGTATAATT 
AATTTTGCAT CAGAATCAAG CCTGGATAAT TGCGCAAACA ATCCGCTAAA TTTCACACAG 
ACCAACGTCC TCGGTACGCA GACGCTGCTT GAAAGCGCCC GTTATTTCTG GGGAAAAAAC 
AAATTTCAGG GCAACCTCTT TATTCAAGTG TCAACCGGTG AGGTATATGG GAGCACACCG 
GCAAATGATG TATTTTTCAG TGAGGAAGCA CCGCTTTTGT CTGACAATCC GTTTTCAGCT 
TCCAAAGCCG GAGCAGATAT GCTGGTAAAA TCCTATACGA TTACCTATGG TTTTCCGGCA 
ATAATAACCC GGTGCTGCCC AACTTACGGA CCTTGTCAGC ATATTGGAAA TTTTATTCCG 
AAATGCATAA TAAATGCGCT TTCGGATAAA CCCATTACGG TCTGTGAAAA CAAAGTGCGG 
GAGTGGATAT ATGTACTGGA CCACTGCATA GCTCTTACAA AGATTTTGTT TTACGGCCGG 
ACAGGTGAAA TCTACAACAT CTCCTCCGGC AACGAAATAT CGGACTTTGA CGTGGCAAAA 
AAGATTCTCG GACTTGTCGG CAAGCCCGAC AGCGCAATTG AAAAGGCAGA TGACAGTTCT 
CTTCCAACCA AAAGATGTAT TCTTAACAGC TACAAACTGA AAAGCAATTT GAATTGGAGT 
ATCAAGTTCA AACTAGAAGA AGGATTAAGG GAAACCATCT TATGGTACAA GCAAAATCCG 
GATAGGTGGA AAAATGTAGA ATTATAA

Protein sequence

MKVMLVTGGA GFVGSNFIRF FLRRNKNFII INMDNLSSTS NLENVKDLEK SPRYHFVKGS 
ITNHELVNYV IKRHRPDCII NFASESSLDN CANNPLNFTQ TNVLGTQTLL ESARYFWGKN 
KFQGNLFIQV STGEVYGSTP ANDVFFSEEA PLLSDNPFSA SKAGADMLVK SYTITYGFPA 
IITRCCPTYG PCQHIGNFIP KCIINALSDK PITVCENKVR EWIYVLDHCI ALTKILFYGR 
TGEIYNISSG NEISDFDVAK KILGLVGKPD SAIEKADDSS LPTKRCILNS YKLKSNLNWS 
IKFKLEEGLR ETILWYKQNP DRWKNVEL