Gene Moth_1309 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1309
Symbol
ID	3831795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1352794
End bp	1354080
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	58%
IMG OID	637829245
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_430165
Protein GI	83590156
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0637456
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.233255
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTACCA ATCACCAGTA TCGTTTTGCC ACCCTGGCCG TTCAAGCCGG CCAGGAGCCC 
GATCCGGCTA CGGGAGCTCG CGCCGTGCCT ATCTACCAGA CTACTTCCTA TGTCTTCCGG 
GATGCCGATC ATGCCGCCGC CCTCTTCGGC CTGAGGGAAG AAGGTAATAT ATATACCCGG 
ATTATGAATC CCACTACCGA TGTCTTTGAA AAAAGGATGG CTGCCCTGGA GGGCGGTGTC 
GGCGCCCTGG CAACGGCTTC CGGCCAGGCG GCCATCACCC TGGCCATAGC TAATATCGCC 
ACCGCCGGAC AGGAGATTGT TGCTTCCACC AGCCTTTACG GCGGCACCTT CAGTCTTTTT 
AATTCAACCC TGCCCAAGTT TGGTATTAAA ACCCGTTTTG TCGACAGCGC CGAACCGGAG 
GATTTCCGGG CTGCCATTAC AGACCGGACC AGGGCCCTTT ATGTGGAAAT CCTGGGCAAT 
CCCAAGCTGG ACGTGCCGGA CCTGGAGGCC CTGGCTGCCA TCGCCCACGA GGCTGGTATT 
CCTTTAATCG TTGATAACAC CTTCGCCACG CCTTACCTGT GCCGTCCGTT TGAATTCGGA 
GCCGATATCG TCGTGCACTC GGCGACCAAG TTTATCGGCG GCCATGGTAC TTCCATTGGC 
GGCATAATTG TCGATTCCGG TAAATTCAAT TGGGATAACG GTAAATTTCC CGGACTGGTA 
GAACCCGATC CCAGTTATCA CGGCCTCAGT TACGTCCAGT CCTTTGGCCC GGCGGCCTAC 
ATCGTCAAGG CGCGGGTCCA GCTCTTGCGG GACCTGGGAC CGGCCTTAAG TCCTTTCAAT 
GCCTTCCTTT TCCTGCAGGG ACTGGAAACT CTGCACCTGC GGATGGAGCG CCACGTCCAA 
AATGCTACCA GGATCGCCGG CTGGCTGGCA GAGCACCCGG CTGTCGCCTG GGTGAGCTAT 
CCGGGCCTAC CCGGCCATCC CTACTACGAA CGGGCCCGAA AATACCTGCC TAAAGGAGCG 
GGGGCCATTT TGACCTTTGG TATTAAGGGC GGCAAGGAGG CCGGTAAGAA GTTTATCAAC 
AGCGTGAAAC TCTTCTCCCT CCTGGCCAAC GTGGGTGATG CCCATTCCCT GGTCATTCAC 
CCGGCCAGTA CCACCCATCA GCAGCTGACA CCGGAGGAAC AGCTGGCCTC GGGTGTTACC 
GAAGATCTGG TCCGCATCTC CGTGGGCCTG GAGGACGTAG AAGACCTGAT TGCCGACCTG 
GACCAGGCAT TAAACAGGAG CCGGTAG

Protein sequence

MTTNHQYRFA TLAVQAGQEP DPATGARAVP IYQTTSYVFR DADHAAALFG LREEGNIYTR 
IMNPTTDVFE KRMAALEGGV GALATASGQA AITLAIANIA TAGQEIVAST SLYGGTFSLF 
NSTLPKFGIK TRFVDSAEPE DFRAAITDRT RALYVEILGN PKLDVPDLEA LAAIAHEAGI 
PLIVDNTFAT PYLCRPFEFG ADIVVHSATK FIGGHGTSIG GIIVDSGKFN WDNGKFPGLV 
EPDPSYHGLS YVQSFGPAAY IVKARVQLLR DLGPALSPFN AFLFLQGLET LHLRMERHVQ 
NATRIAGWLA EHPAVAWVSY PGLPGHPYYE RARKYLPKGA GAILTFGIKG GKEAGKKFIN 
SVKLFSLLAN VGDAHSLVIH PASTTHQQLT PEEQLASGVT EDLVRISVGL EDVEDLIADL 
DQALNRSR