Gene Moth_1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1990
Symbol
ID	3832323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2071845
End bp	2072996
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	62%
IMG OID	637829919
Product	cystathionine beta-lyase
Protein accession	YP_430829
Protein GI	83590820
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.916692
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAGAG GAACGCGACT GATCCATCAC CGCTTATCTA TGGATTCTGC TACCGGAGGG 
GTGAGTATCC CCATCCACCA GAGCGTGGTA TTTGCCCAGG AAAGCCTGGA TCAGCCGGGC 
GAATACGAAT ACACCCGTTC CGGCAATCCT ACCCGGCGGG CCCTGGAAGA GGCCATCGCC 
GAGCTGGAAG GAGGTAATTA CGGTTTTGCT TTTGCTTCCG GAATGGCAGC TATCACCGCC 
GCTTTAAGCC TTTTTTCGTC CGGCGACCAC CTGCTGGTAT CCAGGGATAT CTATGGCGGC 
ACCTACCGGG CCCTGGCCGA GGTTTTCCCG CGTTTCGGCC TGGAAGTAAC CTTCGTGGAT 
ACCACCAACC TGGAGACAGT GGCGGCCCAG ATCCGGCCTT CTACCAAAGG GCTTTACCTC 
GAAACCCCTT CCAACCCGCT GATGAAAATC ACCGACCTGG CCAGGGCCGC CGCCCTGGCC 
AGGGAACACG GCTTGATAAC CATAGCAGAC AATACCTTCA TGACTCCCTA CCTGCAGCGG 
CCCCTGGAAC TGGGAATTGA CATCGTCGTC CACAGCGCCA CCAAATACCT GGGCGGCCAC 
AGCGACTGCC TGGCAGGCCT GGCTGTCACC AGGGACGCCG GCCTGGCCAG GGAACTGACC 
CTGCTGCAAA ACACCCTGGG GACCGTCCTG GCCCCCCATG AGTGCTGGCT GATTTTACGG 
GGCATCAAGA CTCTGAAGGT GCGCCTGCTC CAACAACAAC GGACGGCGAC TGTACTGGCG 
GAATGGTTAC GCAAACACCC GCAAGTGAAG GCCGTCTACT ACCCGGGCCT GGAGGGGCAC 
CCGGGCCGGG AAACGCACTT TCGCCAGGCC GACGGTGGCG GGGGCGTACT CTCCTTCCGC 
CTGGCTACGC CGGAACTGGC CCGCCAGGTC ATTAACAACG TCAGACTGCC GGTCATTGGT 
TCCAGCCTGG GGGCTGTGGA GAGCATCATC TCCCTACCGG CCACCATGTC CCACGGCAGC 
CTGCCGGGAG AGCTAAAGCG CGAACTCGGG ATCACCCCCG ACCTGGTACG GCTGTCGGTG 
GGTCTGGAGG AGGCGGAAGA CCTGCAGGCC GACCTGGAGC AGGCACTGGA TTCTCCCCGG 
GGGCACAGGT AA

Protein sequence

MQRGTRLIHH RLSMDSATGG VSIPIHQSVV FAQESLDQPG EYEYTRSGNP TRRALEEAIA 
ELEGGNYGFA FASGMAAITA ALSLFSSGDH LLVSRDIYGG TYRALAEVFP RFGLEVTFVD 
TTNLETVAAQ IRPSTKGLYL ETPSNPLMKI TDLARAAALA REHGLITIAD NTFMTPYLQR 
PLELGIDIVV HSATKYLGGH SDCLAGLAVT RDAGLARELT LLQNTLGTVL APHECWLILR 
GIKTLKVRLL QQQRTATVLA EWLRKHPQVK AVYYPGLEGH PGRETHFRQA DGGGGVLSFR 
LATPELARQV INNVRLPVIG SSLGAVESII SLPATMSHGS LPGELKRELG ITPDLVRLSV 
GLEEAEDLQA DLEQALDSPR GHR