Gene Cagg_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2030
Symbol
ID	7269189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2491619
End bp	2493211
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	56%
IMG OID	643566865
Product	4-hydroxyphenylacetate 3-hydroxylase
Protein accession	YP_002463354
Protein GI	219848921
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2368] Aromatic ring hydroxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTAT CCGAAGTAAC GGCGGAGACC GCCATAGGCG GTGTGCGTCC AATGAACGGG 
CGTGAGTATC TCGAAAGCCT ACGCGATGAT CGAGTCGTCT ATTTTCAAGG GGAACGGGTT 
AAGGACGTCA CGACTCACCC AGCCTTCCGC AATTCGGCGC GCATGGTAGC GCGATGGTAC 
GACCGGCTCC ATGAACTGCA TCAGGAGGAT GTAGCCCGCG GTGATCCCGA TCAGTGGAAG 
TGGACGATGC CGACCGATAC CGGTAGTGGT GGCTGGACCC ATCCCTTCTT TGTCGGGTCG 
CGGACGGTTG AGGATTTGGT ACGGGCACGG GACACCATTG CCGAGTTGCA GCGGGCAGTT 
TACGGCTGGA TGGGACGTGC GCCTGACTAC AAGGCAGCAT TTACCGGCAC ACTTGGAGCG 
AATGCCGAGT TTTACGCGCC CTATCAGGAG AATGCGCGGC GCTGGTATCG GAAAACGCAG 
GAGGAGTTGA TTTACTGGAA TCATGCGATT GTGAATCCGC CCATCGACCG CAATCGACCG 
CCGGACGAAG TTGCAGACGT GTACATGCAT GTCGAACGGG AGACGGATGC GGGGCTGATT 
GTATCCGGGG CGAAGGTGGT GGCGACCGGT AGTGCCTTAA CCCATGTGAA CTTTATCGCT 
CACTATGGTC CACTGCCGAT CAAAGAGAAG CGATTTGCAC TTATTTTTGC GGTACCGATG 
AACGCGCCCG GCGTGAAGTT AATTGCACGC ACCTCGTATG AATACAACGC GGCAGTCGTC 
GGTAGCCCCT TCGATTACCC GTTATCAAGC CGGCTCGATG AGAACGACTC GATTTTGGTC 
TTCGACCGCG TCCTGATCCC GTGGGAAAAC ATTTTTGTGT ACGGCGACAT TGAGAAGGTC 
AACACCTTCT TCCCAATCTC AGGCTTCGGC CATCGCTTCC CGCTGCACGG TGGTACGCGC 
TTTGCCGTTA AGCTCGATTT CATTACCGGG CTTATGCTCA AAGCGGTTGA GTCAACCGGC 
GTCGCCGAAT TTCGCGGTGT ACAGGCACGA CTTGGTGAGA TCGTCACCTA TCGCAACCTC 
TTCTGGCACT TGACCGAGGC GATGGTGCGT AATCCGATGC CGTGGGTAGA TGGGTACCTC 
TTACCAAATC TCGAAGCCGC CTTCGCCTAC CGTGTGTTAG CGCCGGATGC CTACGTCAAG 
ATCAAAGACC TGATCGAGAA AGATGTTGCG AGCGCGCTGA TCTATCTGCC ATCACATGCA 
GCCGATCTGA AGAACCCTGA AGTACGCGCC TACCTCGACC GTTTCGTGCG CGGTTCAAAT 
GGCACCAGCG CATTCGATCG GATTAAGCTG ATGAAGTTAC TCTGGGACGC AATCGGCACC 
GAGTTTGGTG GTCGGCACGA ACTGTACGAG CGTAACTACG CCGGGAACCA CGAGAACATC 
CGGATCGAGA CCTTGGGAGC AGCAATGGCG ATGGGGGTGA CAGCCAATCT GAAGGCATTC 
GCCGAGCGGT GCATGGCCGA GTATGACCTC GATGGTTGGA CGGTGGACGA CTTGGTCAAT 
CCGACCGATG TTAATGTCGT GATGAGCCGG TAA

Protein sequence

MTVSEVTAET AIGGVRPMNG REYLESLRDD RVVYFQGERV KDVTTHPAFR NSARMVARWY 
DRLHELHQED VARGDPDQWK WTMPTDTGSG GWTHPFFVGS RTVEDLVRAR DTIAELQRAV 
YGWMGRAPDY KAAFTGTLGA NAEFYAPYQE NARRWYRKTQ EELIYWNHAI VNPPIDRNRP 
PDEVADVYMH VERETDAGLI VSGAKVVATG SALTHVNFIA HYGPLPIKEK RFALIFAVPM 
NAPGVKLIAR TSYEYNAAVV GSPFDYPLSS RLDENDSILV FDRVLIPWEN IFVYGDIEKV 
NTFFPISGFG HRFPLHGGTR FAVKLDFITG LMLKAVESTG VAEFRGVQAR LGEIVTYRNL 
FWHLTEAMVR NPMPWVDGYL LPNLEAAFAY RVLAPDAYVK IKDLIEKDVA SALIYLPSHA 
ADLKNPEVRA YLDRFVRGSN GTSAFDRIKL MKLLWDAIGT EFGGRHELYE RNYAGNHENI 
RIETLGAAMA MGVTANLKAF AERCMAEYDL DGWTVDDLVN PTDVNVVMSR