Gene Moth_1946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1946
Symbol
ID	3832296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2020555
End bp	2021496
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	67%
IMG OID	637829877
Product	L-serine ammonia-lyase
Protein accession	YP_430787
Protein GI	83590778
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1760] L-serine deaminase
TIGRFAM ID	[TIGR00718] L-serine dehydratase, iron-sulfur-dependent, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.426247
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000256832
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGACCCGGT ATAATTTTCA AAGCATGGCT GAACTCCTGC AGATAGCCGC GGATGAAGGG 
CTGACCCTGG CCGGGGTAGT CATCCGCTAC CAGGAAGACC TGGAGGGTAA GAGCCGCGAA 
GAGGTGCGCC GGGCGATGGG GGAGAGGCTG GCCGTTATGC GGGCGGCTGC CAGGAAAGGG 
TTGCATGAAG ACATCCGTTC CCCCAGCGGC CTGGTAGGCG GGGGCGGAAA ACTCCTGGAG 
GAAAGGCGCC TGGCAGGGCA GAGCCTCTGT GCCGCCACCA CCGCCCGGGC CATTGCCCTG 
GCCATGGCCG TAGCTGAGGT CAACGCTTCC ATGGGCCGGG TGGTAGCCGC GCCGACGGCT 
GGCTCCTGCG GCATCCTTCC AGGGGTCCTG CTGGCCCTGG AAGCGGAAAA GGGGCTGGAC 
GAAGACCTGC TTATCGATGG GCTCTTTGCG GCCGCCGGTA TCGGCATGGT GGCCGCCGGG 
CAGGCCTCCC TTTCGGGGGC CGCCCTGGGG TGCCAGGCCG AGGTAGGGGT GGCCGCCGCC 
ATGGCGGCAG CGGCGGCCGT GGAAATGACC GGAGGGGATG CGGTCCAGGC CGCCAACGCC 
GCCGGGGTCG CCCTGCAGGG CCTGATGGGA CTGGTCTGCG ACCCCGTGGG TGGCCTGGTG 
GAGGTCCCCT GCGTCATGCG CAACGCCATG GGCGCGGCCC AGGCCCTGGT GGCGGCCGAC 
ATTGCCCTGG CCGGCGTCCA GTGCTATATA CCTTTTGATG AAATAGTCGC AGCCATGGTC 
CAGGTCGGTC GCGCCCTGCC GCCGGAATTA CGGGAGACGG GTGCCGGCGG GATAGCCGCC 
TGTCCCACCG CCCGGAAACT GGCCCGGCAG ATCGGGATCA AAACCCTGGA CAAGGATTCT 
CTCCAGGAGA ATCTTTCGGT AGCAAGCCCT GGTATCCCTT AA

Protein sequence

MTRYNFQSMA ELLQIAADEG LTLAGVVIRY QEDLEGKSRE EVRRAMGERL AVMRAAARKG 
LHEDIRSPSG LVGGGGKLLE ERRLAGQSLC AATTARAIAL AMAVAEVNAS MGRVVAAPTA 
GSCGILPGVL LALEAEKGLD EDLLIDGLFA AAGIGMVAAG QASLSGAALG CQAEVGVAAA 
MAAAAAVEMT GGDAVQAANA AGVALQGLMG LVCDPVGGLV EVPCVMRNAM GAAQALVAAD 
IALAGVQCYI PFDEIVAAMV QVGRALPPEL RETGAGGIAA CPTARKLARQ IGIKTLDKDS 
LQENLSVASP GIP