Gene Cthe_1352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1352
Symbol
ID	4809347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1644326
End bp	1645657
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	40%
IMG OID	640106776
Product	UDP-glucose 6-dehydrogenase
Protein accession	YP_001037777
Protein GI	125973867
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000465012
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATGA TACCAAAAGT TGCAATGTTT GGTACCGGTT ATGTTGGGCT TGTATCCGGA 
GTATGTATAG CCGATTTCGG CATAAACGTC ATTTGTGTTG ATGTTGACAA AGAAAAGATT 
GACGGGCTCA ATAATGGGAA GATTCCTATT TACGAACCAG GACTTGACGT TTTCCTTGAA 
AGAAATATAA AAGCAGGAAG AATACAATTT ACTACAGATG CAAAAATGGC AATAGAAGAA 
TCCAATGTTT TGTTTATTGC TGTAGGCACA CCTCCGAAGG AAAACGGAGA GGCTGACATG 
CAGTATGTAT ATGCTGTTGC TGAAACTATC GGACAGTATA TGAACGGATA TAAAGTTATA 
GTTGATAAAA GCACTGTACC TGTTGGTACA GGTCAGGTTG TTAAGAAAAT AATAGCCGAC 
AAGCTTAAAG AAAGAGGAGT CGAATACTCT TTTGATGTTG TTTCAAATCC GGAGTTTCTT 
CGTGAAGGAA AAGCGCTTTA CGACTTTACT CATCCTGACA GGGTTGTTAT AGGCGTTGAA 
AGTGAAGAAG TTGCAGAGAT AATGAAAAAG GTATACAGGC CTCTGTATAT CAATGAAACA 
CCCTTTGTAA TAACCAACAT AGAAACTGCG GAAATGATTA AGTATGCATC CAATGCATTT 
CTTGCAACCA AGATAACTTT TATAAATGAA ATTGCAAACC TTTGTGAGAA AGTGGGGGCA 
AATGTTCAGC AGGTCGCAAT GGCCATGGGA AGAGACGGAA GAATAGGTCC AAAGTTCCTG 
CATGCAGGAC CGGGTTTTGG AGGAAGCTGC TTCCCAAAGG ATACAAAGGC CCTTGTACAA 
ATAGCTGAGA AGCATGGGGT TCAAATGTCT GTGGTAAATG CGGTAATAGA AGCAAACGAG 
AGGCAGAAGA AAATGGTGGC TGAGAAACTC GAAAAATTTG CAGGAGATTT AAAAGGTAAA 
ACAATAGGCA TACTTGGACT TGCGTTCAAA CCCGAAACGG ATGACGTGAG GGAAGCTCCT 
GCGTTAACAA TAATAGCCGA TTTGATTGAA AGGGGAGCAA GTATCCGCGC GTATGACCCT 
CAGGCCATGG AGGAGGCTAA AAAAGCTCTC AGAAAATACG CGGATAATAT TACTTACTGC 
AAGCATGCCT ATGATACTGC CGAGAGTGTG GATGCATTGG TTATAGTTAC GGAATGGCAT 
GAGTTTCGCA ACATGGACTT GACACTGCTG AAAAAAATAA TGAGGGGAAA TATTTTCTAT 
GACGCCAGAA ATATATACTC GAGAAAGGAT ATAGAAGAAA AAGGATTTGT GTTTATAGGT 
ACCGGAGTAT AA

Protein sequence

MNMIPKVAMF GTGYVGLVSG VCIADFGINV ICVDVDKEKI DGLNNGKIPI YEPGLDVFLE 
RNIKAGRIQF TTDAKMAIEE SNVLFIAVGT PPKENGEADM QYVYAVAETI GQYMNGYKVI 
VDKSTVPVGT GQVVKKIIAD KLKERGVEYS FDVVSNPEFL REGKALYDFT HPDRVVIGVE 
SEEVAEIMKK VYRPLYINET PFVITNIETA EMIKYASNAF LATKITFINE IANLCEKVGA 
NVQQVAMAMG RDGRIGPKFL HAGPGFGGSC FPKDTKALVQ IAEKHGVQMS VVNAVIEANE 
RQKKMVAEKL EKFAGDLKGK TIGILGLAFK PETDDVREAP ALTIIADLIE RGASIRAYDP 
QAMEEAKKAL RKYADNITYC KHAYDTAESV DALVIVTEWH EFRNMDLTLL KKIMRGNIFY 
DARNIYSRKD IEEKGFVFIG TGV