Gene Cagg_1126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1126
Symbol
ID	7268580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1392055
End bp	1393470
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	62%
IMG OID	643565969
Product	Aromatic-L-amino-acid decarboxylase
Protein accession	YP_002462472
Protein GI	219848039
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0076] Glutamate decarboxylase and related PLP-dependent proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0279279
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCATC CTGACGAATT CCGCCGTATT GGCTACCAGA TCATCGACAT GATCGCCGAT 
TACCGTGCAA CCATCGCCAA CCGTCCGGTC TGGTCACAGT TGCGTCCCGG CGAGTTTCGT 
AGTCAGTTGC CGGCCACCCC ACCTGAACAG CCGGAACCAC CGGAAGCGAT CCTCGCCGAT 
GTGGAACGTC TGATCATCCC CGGTTTATCG AACTGGCAAC ACCCCCGCTT TTTCGGTTAT 
TTTCCGGCCA ACGCTAGCCT CGCTTCACTG TTGGGCGATT TTCTCAGTGG TGGTCTCGGT 
CAATTGGGTT TGAATTGGCA GGCTAGCCCA CCGTTAACCG AACTCGAAGA GCTGACAACC 
GACTGGATGC GACAGTTGCT GGGCTTGAGC GAGGCGTGGC GCGGGGTAAT TCAGGATACG 
GCAAGCACCA GTACGCTGGT GGCGTTGCTC TGTGCCCGTG AACGGGCCAG CGACCATAGC 
CAGGTGCGCG GCGGCTTGCA GGCGCTGCCG CAGCCGCTGG TGGTCTATAC CTCAATCCAG 
AGCCACAGTT CGGTGGAGAA GGCGGCGCTG TTAGCCGGTT TTGGCCGCGA TAACCTCCGC 
CTGTTGCCGG TTGACGATAC CTTCGCCCTG CGCGTGGACA CACTCGCCGA TGCTATTGCT 
ACCGACCGCG CCGCCGGTCG AGTACCGTGC GCGGTGGTGG CCAGTATCGG CGCAACGGCA 
ACCACCGCCT GTGATCCGCT CGAACCGATT GGCGAACTGT GCCGGCGTGA GGGGATTTGG 
CTGCACGTTG ATGCGGCAAT GGCCGGCTCG GCGATGATCT TGCCCGAATG TCGCTATCTC 
TGGCAGGGGA TCGAACAGGC CGATAGCCTT GTCCTCAATC CGCACAAATG GCTGGGGGCG 
GCGTTCGATT GCTCGCTTTA CTACGTGCGC GATCCGCAGC ATCTTATCAG AGTGATGTCA 
ACCAACCCCA GTTATTTGCA AACCAGCGCC GACGGCGCTG TCACCAACTA TCGCGACTGG 
GGCATTCCGT TGGGCCGGCG CTTCCGCGCG CTGAAGCTCT ACTTCTTGCT ACGCTGCGAA 
GGGGCCGAGG GGTTGCGCAC CCGCCTGCGC CGCGACATCG CTAATGCTCG CTGGCTGGCT 
GAGCAGATCG ACGCGACGCC GCACTGGCGG CGATTGGCGC CGGTACCGCT CCAGACAGTC 
TGCGTGCGCC ACGAACCACC CGGTCTGACC GGTGAAGACC TTGATCGCCA TACCTTACGC 
TGGGTAGGCG CGATTAATGC CAGCGGTGCA GCGTACCTGA CCCCTGCGAT GCTCGATGGC 
CGTTGGATGG TGCGGATCAG CATTGGCGCC GAGCCAACCG AGCACACTGA TGTGGCGGCG 
CTGTGGGCAT TGATGCAAGA GGTGGTACGA GGGTAG

Protein sequence

MMHPDEFRRI GYQIIDMIAD YRATIANRPV WSQLRPGEFR SQLPATPPEQ PEPPEAILAD 
VERLIIPGLS NWQHPRFFGY FPANASLASL LGDFLSGGLG QLGLNWQASP PLTELEELTT 
DWMRQLLGLS EAWRGVIQDT ASTSTLVALL CARERASDHS QVRGGLQALP QPLVVYTSIQ 
SHSSVEKAAL LAGFGRDNLR LLPVDDTFAL RVDTLADAIA TDRAAGRVPC AVVASIGATA 
TTACDPLEPI GELCRREGIW LHVDAAMAGS AMILPECRYL WQGIEQADSL VLNPHKWLGA 
AFDCSLYYVR DPQHLIRVMS TNPSYLQTSA DGAVTNYRDW GIPLGRRFRA LKLYFLLRCE 
GAEGLRTRLR RDIANARWLA EQIDATPHWR RLAPVPLQTV CVRHEPPGLT GEDLDRHTLR 
WVGAINASGA AYLTPAMLDG RWMVRISIGA EPTEHTDVAA LWALMQEVVR G