Gene Achl_3544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_3544
Symbol
ID	7295025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	3930183
End bp	3931202
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	65%
IMG OID	643591950
Product	Catechol 2,3-dioxygenase
Protein accession	YP_002489589
Protein GI	220914280
COG category	[R] General function prediction only
COG ID	[COG2514] Predicted ring-cleavage extradiol dioxygenase
TIGRFAM ID	[TIGR03211] catechol 2,3 dioxygenase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAACTC CCCTCTCCCA TCTTGCCCAC CTTGAGATCA CCACCCCCGA CGTCGAAGCC 
TCGGCCAAGT TCTACGAGGA AAAGTTCGGA ATGCGCATCA TTGACCGGGT GGATGGCAAC 
GCCTACCTGC GCTGCTGGGG CGACTACTAC CGTTACAGCC TGGTCATCAC CGAAGGCCCT 
GAAGCGTCCC TCGGCCGGAT GGCCTGGCGC ACCAATTCGC AGGCAGCCCT GGAAGCCGCC 
GCCCAGCGCA TTGAAACCAC TGGTGTACAG GGCACCTGGA CCGCCGGCGG CCACGGCTAC 
GGCAAGGCCT ACGAGTTCAC CGGCCCCTAT GGCCACCACA TGCGCCTGTT CTATGAGGTG 
GAAAAGTTCG TGGCCGAGCC CGGCTTCGAG TCCACCTATC CGGACCGTCC CGAGCGTCGC 
AGCAGCCACG CGGCCGCCCC GCGATTCCTG GACCACGTCA CCGTCGCCAC GCAGGACGTC 
CGCGGCTTTG CCAAGTGGTA CAACGAGGCC CTCGGCTTCC GCGTCATGGC ATTCGTGGAC 
CTGGACGAAG CCCCCATCAC GGTCTTCTCG GTCCTGACCA CCAACGAAAA GTCCCACGAC 
CTCGGCGTCG TCCTGGACAC CTCCAACCGC CCCGGCCGCG TCAACCACAT TGCCTTCTGG 
GTAGATGCCA CGGAGGACCT GCTCCGCACC GCCGACGTCA TGATGGAGAA CGGGACCCCC 
ATGGAATATG GCCCCTCCAT CCACGGCGTG GGCGAGCAGA ACTTCCTCTA CTTCCGTGAC 
CCCTCCGGCC TGCGCGTCGA GCTGAACTCC GGCGGCTACC GCAACTACGT TCCGGACTGG 
GAGGCCAACA CCTGGAAGCC GTCCGAGGGC TCCAATAACT TCTACAAGAA CGGCGCCATG 
CCGCACTCCA TGACCGAGTC CTTCCCGCCG GCCGAAGGTT TCACCGCCAC TGAAGAGGGC 
GCCTCCCCGG AAATGAAGGA AGCACTCCTG AACCCCTACG CCCAGCAGGG CCGGGGCTAA

Protein sequence

METPLSHLAH LEITTPDVEA SAKFYEEKFG MRIIDRVDGN AYLRCWGDYY RYSLVITEGP 
EASLGRMAWR TNSQAALEAA AQRIETTGVQ GTWTAGGHGY GKAYEFTGPY GHHMRLFYEV 
EKFVAEPGFE STYPDRPERR SSHAAAPRFL DHVTVATQDV RGFAKWYNEA LGFRVMAFVD 
LDEAPITVFS VLTTNEKSHD LGVVLDTSNR PGRVNHIAFW VDATEDLLRT ADVMMENGTP 
MEYGPSIHGV GEQNFLYFRD PSGLRVELNS GGYRNYVPDW EANTWKPSEG SNNFYKNGAM 
PHSMTESFPP AEGFTATEEG ASPEMKEALL NPYAQQGRG