Gene Cagg_0043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0043
Symbol
ID	7269040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	64886
End bp	66121
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	58%
IMG OID	643564916
Product	threonine dehydratase
Protein accession	YP_002461432
Protein GI	219846999
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01124] threonine ammonia-lyase, biosynthetic, long form [TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCGGT TTGCTATCGA ACTCGCCGAT ATTCAAGCTG CCCGGCGTGC CTTGCGCTCG 
ATAATTTTGC CGACGCCGGT ACTGCCTGCT ACCCGACTCA GCGCGGAGCT AGGCGGGCCG 
ATCTTTTACA AAGCTGAGAA TACCCAACAG AGTGGTTCAT TTAAGATTCG GGGCGCGTAT 
AACACCATCG TTCATCTTTC ACCCGAAGAA AAGGCGCGTG GCGTGATCGC ACCCTCCGCC 
GGGAACCATG CCCAAGGTGT TGCCCAGGCT GCACAATTAC TCGGCGTAAA AGCAACGATT 
GTTATGCCCG AACGTGCTCC GTTGACCAAA GTGGTTGCCA CCCGTCGGCT CGGCGCCGAA 
GTCATCCTAC ACGGTGCGAC GTTTGATGAT GCAGTTGCTT ACGCTCATAC TTTGAAGGAA 
GAACGAGGTC TGACGTATGT CCATGCGTTT GATCATCCGC GTGTGATTGC CGGTCAAGGA 
ACTATCGGGC TGGAATTGGT TGAAGCCCTC CCCGATCTGC AACAACTCAT CGTTCCGATT 
GGGGGTGGTG GTTTGATCGG CGGCATTGCC CTCGCCGTCA AGACCTTGCT CCCGCACGTC 
CGTATCGTTG GTGTACAAGC CGCCGGTTGC GCACCGGTGC CGGCATCACT CGCTGCCGGC 
CATCCGGTTA CGGTACCTAC CGCACACACG ATTGCCGACG GTATCGCCGT TAAGCGTCCC 
GGAGAACTAA CCTTACCGAT GATTCAAGCA CTCGTCGATG AGGTGGTCAC CGTCGATGAT 
GAAGAGATTG TGATGGCGAT AGCCCACGTC TTGCAATATA GCCGGCTAGT GGTTGAGGGT 
GCCGGTGCAG CCGGTGTGGC AGCACTGCTC AGTGGGAAGG TGCCGGTCCA ACCGAATCAG 
GTCACCGCGA CCATTCTCTG CGGTGGGAAT ATCGACGCCA ACCTGCTCAT GCGCGTGATC 
GAATATGCGC TGGTGCGACA GGGGCGCTAC CTCCTCCTCC GTACCAGTGT CGACGACCGA 
CCGGGTGGAT TAGCAGCGCT CGTCAATCAC GTTGCCTCGA CCGGTGCGAG TGTAATGGAC 
CTGTTCCATC GCCGGGGGAT GTGGCGAGTG CCGATTGACC GTGCCGGTGT CGAGTTGATC 
CTTGAGGTGC GCGATGAGGA GCATACCCAA GCAGTGATCG ATTCCCTGGA ACGGGCCGGG 
TTCCATTGTG AACGCGAATC GAATTGGCCG TTGTGA

Protein sequence

MNRFAIELAD IQAARRALRS IILPTPVLPA TRLSAELGGP IFYKAENTQQ SGSFKIRGAY 
NTIVHLSPEE KARGVIAPSA GNHAQGVAQA AQLLGVKATI VMPERAPLTK VVATRRLGAE 
VILHGATFDD AVAYAHTLKE ERGLTYVHAF DHPRVIAGQG TIGLELVEAL PDLQQLIVPI 
GGGGLIGGIA LAVKTLLPHV RIVGVQAAGC APVPASLAAG HPVTVPTAHT IADGIAVKRP 
GELTLPMIQA LVDEVVTVDD EEIVMAIAHV LQYSRLVVEG AGAAGVAALL SGKVPVQPNQ 
VTATILCGGN IDANLLMRVI EYALVRQGRY LLLRTSVDDR PGGLAALVNH VASTGASVMD 
LFHRRGMWRV PIDRAGVELI LEVRDEEHTQ AVIDSLERAG FHCERESNWP L