Gene Cagg_1659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1659
Symbol
ID	7268961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2024485
End bp	2025768
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	59%
IMG OID	643566501
Product	imidazolonepropionase
Protein accession	YP_002462996
Protein GI	219848563
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID	[TIGR01224] imidazolonepropionase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACCCT GTGACCTGCT GATCCACTCG GCCACACAAC TCGTAACGTG TGCTGGGCCG 
CCCGGTTTGC GTCGTGGCCC GGCGATGCGC GAATTGGGAG TCATCCGCGA CGGAGCAGTC 
GCTATTCGTG GATCGACCAT TGTGGCCGTT GGTCCTGGCA CCGATGTCCG CCGTCGCTTC 
CGTGCGTCCC ACGAGATTGA TGCCCGCGGA CGGGCCGTGT GTCCCGGTTT GGTCGATTGT 
CATACCCATA TCGTGTACGC CGGTGATCGG GTTGAGGAAT TTGAACAGCG CTGTGCCGGC 
GCTACGTATC AAGAGATTAT GGCCGCCGGT GGTGGTATTT TACGCACCAT GCGGCTCACC 
CGTGCGGCGA CAACTACCGA ACTGGTTCAT GCGGCACTAC CTCGCTTGCG GCAGATGTTG 
TCGTTCGGGA CGACTACCGC CGAAGTGAAG ACCGGTTACG GTCTTGAACG CGACGCAGAA 
TTACGTCAAT TGGCAGCTAT TGCGCTGCTT GATGCGGCAC AACCGATTGA GCTTGTCCCT 
ACCTTTCTCG CAGCGCATGC GGTGCCACCA GAGTTTACCG GTCGAGCCGA TGACTACATT 
GATCTGGTAG TCGAGTCGAT GTTGCCGCTC GCTCGCGACT GGTATGCTGT CTCATCATTC 
GCTGCGCGCG CGATTCCGCT CTTCGTTGAT GTCTTCTGTG AGCGAGGTGC GTTCGATGTG 
GCGCAGAGTC GGCGAGTGTT GGACGCAGCA CGCAGTTTGG GCCTACCGCG CAAAGCCCAC 
GTCGATGAGT TTGTCGAGCT GGGTGGGCTG GCAATGGCGC TTGAACTGGG TGCCACGTCA 
GTCGATCACC TCGATGTTAC CGGCCCGTCG GCCTTTACAG CACTGGCAGC CAGCTCGACC 
GTCGCCGTCT TGTTACCGCT CGTCTCGCTC AATCTCGGTC TGAGCCATTT TGCTGCTGCA 
CGGGCAATGA TCGATGCCGG CGTTGCCGTT GCGCTCAGCA CCGATGCCAA CCCCGGTTCG 
GCGCCATCGC TGTCATTACC GTTGACAATG GCAATCGCCT GTCGCTACCT GCGCATGCTT 
CCTGCCGAGA CATTGATTGC AACGACGGTC AACGCTGCCT ATGCGATCGG TCGCGGTGGG 
CATGTTGGAG CATTAATGCC TGGTATGCAG GCCGATCTGC TCATCTTGGC CGCCGATGAT 
TATCGCTGGC TGATGTATGA GTTAGGTGGA ATGCCGGTGG CACAGGTGAT CAAACGAGGG 
CAGGTCGTAG TTACCAATGA GTAA

Protein sequence

MEPCDLLIHS ATQLVTCAGP PGLRRGPAMR ELGVIRDGAV AIRGSTIVAV GPGTDVRRRF 
RASHEIDARG RAVCPGLVDC HTHIVYAGDR VEEFEQRCAG ATYQEIMAAG GGILRTMRLT 
RAATTTELVH AALPRLRQML SFGTTTAEVK TGYGLERDAE LRQLAAIALL DAAQPIELVP 
TFLAAHAVPP EFTGRADDYI DLVVESMLPL ARDWYAVSSF AARAIPLFVD VFCERGAFDV 
AQSRRVLDAA RSLGLPRKAH VDEFVELGGL AMALELGATS VDHLDVTGPS AFTALAASST 
VAVLLPLVSL NLGLSHFAAA RAMIDAGVAV ALSTDANPGS APSLSLPLTM AIACRYLRML 
PAETLIATTV NAAYAIGRGG HVGALMPGMQ ADLLILAADD YRWLMYELGG MPVAQVIKRG 
QVVVTNE