Gene Achl_0672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_0672
Symbol
ID	7292102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	713813
End bp	714844
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	64%
IMG OID	643589069
Product	2OG-Fe(II) oxygenase
Protein accession	YP_002486758
Protein GI	220911449
COG category	[R] General function prediction only
COG ID	[COG3491] Isopenicillin N synthase and related dioxygenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACACG ACCAGGGAGC CATACCTGTT CTGGATTTGA GTACCGCACG GCAGCCCTAC 
GGGACCTTCA GTCCGGAATT CATCGAGCAG TTGCGGCACG CCACCCATGA CGTGGGCTTC 
TTCCAGATCA CGGGCTACGG GGGTTCGCCG GGGCAGGCGG ACCAACTCCT TGACGCTGTC 
CGGCGGTTCT TCAACCTTCC CCTTGAAGAA CGGATGAAAC TGGACAACCG GCTTTCTCCA 
CACTTCCGCG GCTACACCCG GATGGGAACC GAAGTGACGC AGGGGCGGGC GGATGCGCGG 
GAGCAGATCG ACTACTCTCC CGAGCGCCCG CCGGTAAGCA GCTACCCGCC GGACCAGCCG 
TACTGGCTGC TGCAGGGACC AAACCAGTGG CCGGACGAAG CGTTCCCTGA ACTGAAGCCG 
GCAGCCATGG CCTGGGCCGA GCTGATGTCC GCGGTGGGGA TGGAACTGCT GCGCGCCATT 
GCGGTGACGC TGCAACAACC CGAGGACTAT TTCGACGAAC CGTTCCGGGA AGCACCGGCA 
TGGATGGGCA AATTGGTCCA TTATGTTGGC GGCGTGGTCA AAGAGGCAGG TAACCAGGGG 
GTGGGTTCCC ATGCTGACTA CGGGTTCGTG ACACTCCTGC TGCAGGACGA CGTTGGAGGC 
CTGGAAGTAA AGCCGCCGGG GACCTCGGAA TGGCTTCCGG TGGAGCCCCT GCCCGGCGCG 
TTGGTGGTGA ACCTCGGCGA AATGCTGGAA GTGGCCACCG AGGGATACCT TGCGGCCACG 
ATCCACCGCG TGCAGGCACC GCCTCCGGGT GTGGACCGCT ATTCGGTGCC GTTCTTCTGG 
TCGCCCCGCT TGGACTCAGT CATCCAGCCT GTTCCGCTGG CCCCGGAGTT GAAGGCCGCC 
GCACGCGGCA TTACGGACGA TCCCGGCAAC CCGTTGCTCG CATCCTTTGG CCTCAACATG 
CTCAAGGGCA GAATGCGGGC GCACCCGGAC GTCACCGAGC GGCATTACCC GGACCTGCTG 
AAGCGGAGCT AG

Protein sequence

MSHDQGAIPV LDLSTARQPY GTFSPEFIEQ LRHATHDVGF FQITGYGGSP GQADQLLDAV 
RRFFNLPLEE RMKLDNRLSP HFRGYTRMGT EVTQGRADAR EQIDYSPERP PVSSYPPDQP 
YWLLQGPNQW PDEAFPELKP AAMAWAELMS AVGMELLRAI AVTLQQPEDY FDEPFREAPA 
WMGKLVHYVG GVVKEAGNQG VGSHADYGFV TLLLQDDVGG LEVKPPGTSE WLPVEPLPGA 
LVVNLGEMLE VATEGYLAAT IHRVQAPPPG VDRYSVPFFW SPRLDSVIQP VPLAPELKAA 
ARGITDDPGN PLLASFGLNM LKGRMRAHPD VTERHYPDLL KRS