Gene Cthe_1022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1022
Symbol
ID	4811316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1224150
End bp	1225169
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	45%
IMG OID	640106440
Product	glycerol-3-phosphate dehydrogenase (NAD(P)(+))
Protein accession	YP_001037447
Protein GI	125973537
COG category	[C] Energy production and conversion
COG ID	[COG0240] Glycerol-3-phosphate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0256064
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAA AAATATCCAT AATTGGTGCG GGAAGCTGGG GGACCGCTCT GGCGGTGTTA 
TTGGCCAACA ACGGCATGAG TGTTACCATG TGGTCGATTT TTGAAGACGA AATTAAGATG 
CTGAACGAAA AAAGAGAGCA TGTACATAAG TTGCCGGGTG TTATTGTTCC GGAGAATGTC 
ACATTTACAT CGGATCTTGA AAAAGCTGTG TGTGATGCCG AGGTTGTGGT TGTGGTGGTA 
CCTTCCCAAA CTGTCAGGCA GACTGCAAAG GATATATCGA AATATATAAG GGATGATACG 
GTAATTGTTA GTTGTTCCAA AGGGTTGGAG GAAGGAACGG GGCTTAGAAT GTCCGAGGTA 
ATAGGTCAGG AGATAAAAGA CGCAAAAACC GTTATCCTTT CAGGTCCAAG CCATGCCGAA 
GAAGTGGGAA GAGGTGTGCC CACGGCAATT GTGGCGGCAT CTTGTGATAT CAAAGCGGCG 
GAACTTATTC AGGATATATT CATGTCACCG GAATTTAGAG TTTACACCAA CACGGATGTT 
GTCGGAGTGG AGCTTGGAGG TGCCTTGAAA AATGTAATAG CATTGTGTGC CGGAATATCG 
GATGGTTTGG GTTTTGGGGA CAATACCAAG GCTGCGCTTA TGACAAGAGG AATAACCGAA 
ATTTCAAGGC TGGGAGTTTC CATGGGGGCA AATCCCCAGA CTTTTGCCGG ACTTACGGGT 
ATAGGAGACC TTATTGTGAC TTGTACCAGC ATGCACAGCA GAAACAGGCG TGCCGGAATT 
TTGATCGGTC AGGGAAAATC ACCGCAGGAA GCAATGGATG AAGTTAAAAT GGTTGTTGAG 
GGTGTTACAA CGACAAAAGC AGCTTATGAA CTTGCACGGA AAATGGATGT TGCGATGCCC 
ATAACCTTCG AAGCATACGA AGTATTGTTT AACGGAAAGA ATCCAAGACA GGCAGTGTAT 
GATCTTATGA TGAGGAACAA GAAAAATGAG GTTGAAGAAT TGGATGCCAA ATGGCTTTGA

Protein sequence

MNKKISIIGA GSWGTALAVL LANNGMSVTM WSIFEDEIKM LNEKREHVHK LPGVIVPENV 
TFTSDLEKAV CDAEVVVVVV PSQTVRQTAK DISKYIRDDT VIVSCSKGLE EGTGLRMSEV 
IGQEIKDAKT VILSGPSHAE EVGRGVPTAI VAASCDIKAA ELIQDIFMSP EFRVYTNTDV 
VGVELGGALK NVIALCAGIS DGLGFGDNTK AALMTRGITE ISRLGVSMGA NPQTFAGLTG 
IGDLIVTCTS MHSRNRRAGI LIGQGKSPQE AMDEVKMVVE GVTTTKAAYE LARKMDVAMP 
ITFEAYEVLF NGKNPRQAVY DLMMRNKKNE VEELDAKWL