Gene Cthe_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1559
Symbol
ID	4810066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	1887838
End bp	1889001
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	46%
IMG OID	640106977
Product	cystathionine gamma-lyase
Protein accession	YP_001037978
Protein GI	125974068
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCACATT ACAAACATAT TGAATCGGCA GTCATCCATG GTGGCATTTA TGGAGATTTC 
CATACCGGTT CGGTAAATAC CCCTATTTAT CAAACCTCCA CCTTTGAACA GGACGGTTTG 
GGCAAGCCCC GCTCAAATTG GGAATATTCC CGAACGGGAA ATCCCACTCG GGCAGCTTTG 
GAGGCTTTGA TTGCAGAGTT GGAGGGTGGG TCCCGGGGAT TTGCATTTTC TTCCGGTATG 
GCAGCCATTG ATGCAGTTCT GCATCTCTTC CAATCCGGAG ACAGCGTCAT TATTTCCGAC 
AATGTATATG GAGGGACTTT TCGAATTCTG GATAAAATCT TCAAGCAGTA TGGCTTAAAC 
TATAAAATTG TGGACACCAC TGATTTGGCA GCACTCGAAA GTGCATTTAC TTCGGATGTT 
AAAGCTTTGT TGCTTGAATC CCCGGCCAAT CCGCTGCTCA AAGTTACGGA TATCGCGGCG 
GCAGCTGAGA TAGCAAGATC CAAAGGAGCG CTGACTGTAG TGGATAACAC CTTTATGACC 
CCTTATCTTC AACGGCCTTT AGAGCTTGGA GCGGATATCG TCGTGCATTC GGCAACCAAA 
TATCTTGGCG GACATAGCGA TGTCATTGCA GGACTTGTCA TCGTTAAAGA CGGTGAACTG 
GCAGAAAAGC TGCATTTCAT ACAAAATGCG GTGGGTGCCG TTGCCGGGCC GTTTGATTCT 
TTCCTGCTCA TTCGAAGTAT CAAGACGTTG GCAGTGCGCA TGGAAGCCCA TGTGGCCAAC 
GCAGAAAAAC TAGCAGAGGC TTTAAAAAGT AATCCGGCAG TTAAAAACGT CTATTATCCC 
GGCTTAAAAT CCGCTCAAGG ATATGAGATT CAAAAGAGAC AGGCAAAAAA CGGCGGAGCC 
ATGATTTCCT TTGAGTTACA TAACAATTAT GACATCAACA GGTTTTTTGA AGGTTTGGAG 
TTGATTGCCC TTGCGGAAAG CTTGGGCGGT GTTGAAAGTC TTGTCTGCCA TCCTTCAAGC 
ATGACCCATG CATCTGTTCC AAAGGAAATA CGCGAAAAGA TCGGCATCAC GGATACATTG 
ATCCGCTTGT CGGTAGGTAT TGAAAATTAT GATGATTTAA AAAACGATTT ATTTTCTGCT 
ATAAAAGGAG CGCGAGTACT ATGA

Protein sequence

MAHYKHIESA VIHGGIYGDF HTGSVNTPIY QTSTFEQDGL GKPRSNWEYS RTGNPTRAAL 
EALIAELEGG SRGFAFSSGM AAIDAVLHLF QSGDSVIISD NVYGGTFRIL DKIFKQYGLN 
YKIVDTTDLA ALESAFTSDV KALLLESPAN PLLKVTDIAA AAEIARSKGA LTVVDNTFMT 
PYLQRPLELG ADIVVHSATK YLGGHSDVIA GLVIVKDGEL AEKLHFIQNA VGAVAGPFDS 
FLLIRSIKTL AVRMEAHVAN AEKLAEALKS NPAVKNVYYP GLKSAQGYEI QKRQAKNGGA 
MISFELHNNY DINRFFEGLE LIALAESLGG VESLVCHPSS MTHASVPKEI REKIGITDTL 
IRLSVGIENY DDLKNDLFSA IKGARVL