Gene Cthe_0374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0374
Symbol
ID	4808451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	470198
End bp	471532
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	43%
IMG OID	640105788
Product	glutamate dehydrogenase
Protein accession	YP_001036805
Protein GI	125972895
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0334] Glutamate dehydrogenase/leucine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000129016
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTAT TGGCTGGTGT AATGGAACAA GTCATTAAAA GAAATCCAAA TGAACCTGAG 
TTTCATCAAG CGGTAAGAGA AGTGTTGGAG TCGCTGGAAA TAGTCGCCGA AAAAAATCCG 
GAGTACTTAA AAGCAGGTAT ATTTGAAAGG ATTGTTGAAC CTGAAAGACA GATTATTTTC 
AGAGTACCGT GGGTGGATGA CAATGGCAAG GTACAGGTAA ACAGAGGTTT TAGAGTTCAG 
TTCAACAGTG CAATTGGTCC TTACAAGGGC GGAATAAGAT TCCATCCTTC GGTTAACTTG 
GGAATTATCA AATTCCTTGG TTTCGAGCAG ATTTTCAAGA ATTCATTGAC CGGCCTTCCA 
ATGGGGGGAG GAAAAGGCGG CAGCGACTTT GATCCGAAAG GAAAATCCGA CGGAGAAATC 
ATGAGGTTCT GTCAGAGCTT TATGACCGAG CTTTACAGAC ATATCGGACC GGATACCGAC 
GTTCCTGCGG GAGATATCGG TGTAGGTGCC CGTGAAATAG GTTATATGTT CGGCATGTAC 
AGAAAAATAA GAAACGAGTT TACCGGAGTT CTGACAGGAA AAGGACTGAC ATGGGGCGGA 
AGCCTTGTAA GAACTGAGGC TACAGGTTAT GGTCTCTGCT ACTTCATGGA AGAAGCAATG 
AAGACAATAA AAGGTAAATC TTTTGAAGGT GCGACAGTTG TTATCTCAGG TTCGGGCAAT 
GTGGCCATTT ATGCAACGGA AAAAGCTCAG CAGCTTGGTG CTAAAGTAGT TGCATTGAGC 
GATTCAAACG GATATGTTTA TGATCCTGAC GGAATAAAAC TCGATACGGT TAAGCAAATA 
AAAGAGGTAG AAAGAAAGAG AATCAGTGAA TATGTAAAAT ATCATCCTAA TGCAAAATAT 
ACAGAAGGAT GTTCAGGAAT ATGGTCAGTC AAGTGTGATG TTGCGCTTCC GTGTGCAACT 
CAGAACGAGC TTGACGGAAA CGCGGCAAAG ACTCTTGTTG AAAACGGATG TTATGCGGTA 
GGAGAAGGTG CAAACATGCC GTGTACGCCT GAAGCTATTG ATATATTTAT GAAGAACGGC 
GTTCTTTATG CTCCAGGAAA AGCTTCAAAT GCCGGCGGTG TTGCAACTTC CGGACTTGAA 
ATGTGCCAGA ACAGCATGAG GTATTCCTGG TCTTTTGAAG AAGTTGACGC CAAGTTGAAG 
GATATTATGG TTAACATATT CAGAAATGTA AGAGCGGTAG CAAAAGAATA CGGCCAGGAA 
GACAATCTTG TTTTGGGTGC AAATATTGCA GGATTCCTGA AAGTTGCAAA TGCTATGATG 
GCACAGGGAG TGTAA

Protein sequence

MKLLAGVMEQ VIKRNPNEPE FHQAVREVLE SLEIVAEKNP EYLKAGIFER IVEPERQIIF 
RVPWVDDNGK VQVNRGFRVQ FNSAIGPYKG GIRFHPSVNL GIIKFLGFEQ IFKNSLTGLP 
MGGGKGGSDF DPKGKSDGEI MRFCQSFMTE LYRHIGPDTD VPAGDIGVGA REIGYMFGMY 
RKIRNEFTGV LTGKGLTWGG SLVRTEATGY GLCYFMEEAM KTIKGKSFEG ATVVISGSGN 
VAIYATEKAQ QLGAKVVALS DSNGYVYDPD GIKLDTVKQI KEVERKRISE YVKYHPNAKY 
TEGCSGIWSV KCDVALPCAT QNELDGNAAK TLVENGCYAV GEGANMPCTP EAIDIFMKNG 
VLYAPGKASN AGGVATSGLE MCQNSMRYSW SFEEVDAKLK DIMVNIFRNV RAVAKEYGQE 
DNLVLGANIA GFLKVANAMM AQGV