Gene Moth_1942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1942
Symbol
ID	3832434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2015713
End bp	2017170
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	62%
IMG OID	637829873
Product	glycine dehydrogenase subunit 2
Protein accession	YP_430783
Protein GI	83590774
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1003] Glycine cleavage system protein P (pyridoxal-binding), C-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000124327
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000296653
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGACGG AACCCTTACT ATTTGAACTC GGTGCCCCCG GAAGGCAAGG TTACACCCTG 
CCGGAATGTG ATGTACCGGG GAAAGTGGAG GATTACCTCC CCGAAGCAAC ACGCCGCCGG 
TCCGATGCTG CCCTGCCGGA ATTGAGCGAA GTAGAGGTCG TCCGCCATTT TACCCATTTA 
TCCACTATGA ACTATGGCGT CGATACCGGT TTCTACCCCT TAGGTTCCTG TACCATGAAG 
TATAACCCCA AGATCAATGA AGCGACGGCC AACTTGCCAG GCTTTACGGG ACTGCACCCG 
CTGGTGCCGG TTGAGGCGGC CCAGGGGGCC CTGGAACTCA TGTACAACCT GCAGGAGTAT 
CTCGCGGAAA TCACCGGCAT GGATGCCATC ACCCTGCAGC CGGCCGCCGG CGCCCACGGA 
GAGTATACCG GCCTGGCTGT CATCGCCGCC TATCATCAGA GCCGCGGTGA CCGGGAACGG 
CGCCAGGTGC TGGTGCCGGA TTCCGCCCAT GGCACCAACC CGGCCAGTGC CGCCATGGCC 
GGCCTGGAGG TAGTCCAGAT ACCCTCCGAC GAGGGGGGGC TAGTGGATCT TGAAGCCCTG 
AAGGCTGCCG TCGGCCCCAG GACGGCGGCC CTGATGCTGA CCAACCCCAA CACCCTGGGC 
CTCTTTGAGA GCAATATCGA GGCCATGGCA GCCATCGTCC ATGCAGCCGG CGGCCTCCTC 
TATTATGACG GCGCCAACCT GAACGCCATC ATGGGCCTCA CCAGGCCGGG AGATATGGGC 
TTTGACGTAG TTCACTTAAA CCTCCACAAG ACCTTCTCCA CCCCCCACGG CGGCGGTGGT 
CCCGGCAGCG GCCCGGTGGG GGTGAAGGAG CACCTGGCTG CCTTCCTGCC GGTGCCGGTG 
GTGGCTCGCC GGGAGGACGG CCAGTATTAC CTGGATTACG ACCGGCCCCA GAGCATCGGC 
CAGGTACGTT CCTTCTATGG TAATTTCGGC GTCATGGTCA AGGCCTACAC CTATATCCGC 
TCCCTGGGGG CCCCGGGCCT GAAGAGGGTC AGCCAACAGG CGGTTTTGAA TGCCAACTAC 
ATGCTGGCGC GCCTCAGGCC CTACTTCAAG GTGCCCTTCG ACCGGCTGTG CAAGCACGAG 
TTTGTCATCG CACCGTCCCA GGAGGTAACT GATGCCGGCG TTCATACCCT GGATATAGCC 
AAACGCCTCC TGGACTACGG TTTCCATGCG CCTACCATCT ACTTCCCCCT CATTGTCCGC 
GAGGCCATGA TGATCGAACC GACGGAAACG GAGCCCCGGG AGAACCTGGA CGCCTTCTGC 
GACGCTTTGA TTGCTATTGC TAAAGAGGCA GTTGAGAACC CGGAGGCTCT GCACCAGGCG 
CCCCATAACA CCCCAGTGCG GCGCCTGGAC GAGGTGGGCG CTGCCAGGAA CCCGGTTTTA 
CGCTGGCGGG GCAGGTAG

Protein sequence

MKTEPLLFEL GAPGRQGYTL PECDVPGKVE DYLPEATRRR SDAALPELSE VEVVRHFTHL 
STMNYGVDTG FYPLGSCTMK YNPKINEATA NLPGFTGLHP LVPVEAAQGA LELMYNLQEY 
LAEITGMDAI TLQPAAGAHG EYTGLAVIAA YHQSRGDRER RQVLVPDSAH GTNPASAAMA 
GLEVVQIPSD EGGLVDLEAL KAAVGPRTAA LMLTNPNTLG LFESNIEAMA AIVHAAGGLL 
YYDGANLNAI MGLTRPGDMG FDVVHLNLHK TFSTPHGGGG PGSGPVGVKE HLAAFLPVPV 
VARREDGQYY LDYDRPQSIG QVRSFYGNFG VMVKAYTYIR SLGAPGLKRV SQQAVLNANY 
MLARLRPYFK VPFDRLCKHE FVIAPSQEVT DAGVHTLDIA KRLLDYGFHA PTIYFPLIVR 
EAMMIEPTET EPRENLDAFC DALIAIAKEA VENPEALHQA PHNTPVRRLD EVGAARNPVL 
RWRGR