Gene Moth_1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1989
Symbol
ID	3832322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2070631
End bp	2071767
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	56%
IMG OID	637829918
Product	cysteine synthase / cystathionine gamma-synthase
Protein accession	YP_430828
Protein GI	83590819
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.485291
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTGG CTACAGAGCT GGTCCAGCTG GGAGTAGGGT ATGATAGTAA AACGGGAGCT 
ATCAGCACGC CTATCTACCA GTCAGCTACC TTCCGTCACC CGGCCCTGGG GCAGAGTACT 
GGTTTTGACT ACAGCCGGAC AGGCAACCCT ACCCGCCAGG TCCTGGAAGA AGGCCTGGCC 
GGGCTGGAGG GAGGCTGTCG CGCCCTGGCC TTTGCCTCCG GCATGGCCGC CATTACCGCC 
GTTCTCTGCC TTTTCCGGCC CGGCGACCAC CTGGTGGTTT CTGAGGATTT ATACGGCGGT 
ACTTACAGGC TGCTAAACCA AGTAGCGGTT CCCTTGGGGC TGGAGTTTTC CCTTGTAGAT 
ACTACTGACC TGGCTGCCCT GGCTGCATCT ATAAGGAACA ATACGAAAGG CATCTTCCTG 
GAGACACCTA CCAACCCACT AATGAAAATC ACCGATATTG CCGCCGTGGT TGCCCTGGCC 
CGCCAGAGGG GCCTGTTGAC TATTGTAGAT AATACTTTTA TGACCCCTTA CCTGCAGCGA 
CCCCTGGAAC TGGGAGCGGA CCTGGTGGTC CACAGCGCCA CCAAATATTT AGGCGGTCAC 
AATGATGTAG TTATGGGGGC AGCGATAGCC GCCCGGGAGG ATCTCAGCGA AAGGCTGGCC 
TTTATCCAAA ATACCATCGG CGCGATTCCC GGTCCCCAGG ACTGCTGGCT GGTAATCCGG 
GGCTTGAAAA CCCTGGCCGT ACGCCTGGAG CGAGCCCAGG CCAACGCTTT TGAGCTGGCC 
CGGTGGCTGG CCGAACACCC CCTGGTGACC AGGGTTTATT ATCCGGGCCT CCCCCATCAT 
CCCGGTCACG AAATATGTAA AAAACAGTCC AGCGGGTTCG GGGCCATGCT TTCCTTTGAA 
GTCAAGCACG CCGGACTGGT GGAGCAGATT TTACAGCGCT TAAAAATTAT TTCCTTTGCG 
GAAAGCCTGG GTGGGGTAGA AAGCTTGATC ACTTTTCCGG AACGCCAGAC CCATGCCGAA 
ATCCCTGCTG AGATGCGTCT TAAACTGGGC ATCAATGATC GTTTGTTACG TTTGTCAGTC 
GGACTGGAAG ACTTGAACGA TCTCAAGGCC GACCTGGACC AGGCTCTGGC CTGTTAA

Protein sequence

MRLATELVQL GVGYDSKTGA ISTPIYQSAT FRHPALGQST GFDYSRTGNP TRQVLEEGLA 
GLEGGCRALA FASGMAAITA VLCLFRPGDH LVVSEDLYGG TYRLLNQVAV PLGLEFSLVD 
TTDLAALAAS IRNNTKGIFL ETPTNPLMKI TDIAAVVALA RQRGLLTIVD NTFMTPYLQR 
PLELGADLVV HSATKYLGGH NDVVMGAAIA AREDLSERLA FIQNTIGAIP GPQDCWLVIR 
GLKTLAVRLE RAQANAFELA RWLAEHPLVT RVYYPGLPHH PGHEICKKQS SGFGAMLSFE 
VKHAGLVEQI LQRLKIISFA ESLGGVESLI TFPERQTHAE IPAEMRLKLG INDRLLRLSV 
GLEDLNDLKA DLDQALAC