Gene Arth_4205 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4205
Symbol
ID	4443606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008539
Strand	+
Start bp	37454
End bp	38500
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	69%
IMG OID	639687730
Product	putative fatty acid beta hydroxylase (cytochrome P450)
Protein accession	YP_829427
Protein GI	116662374
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.73506
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCGCT CTGCCCAGCA CCTGCTGCAG GACGCCGGCA GCGTGCAGTC CCTCGAAGGG 
CCCGCCCACC GGCACCGGAA ACAGCTGTTT CGTGACCTGA TGACCAAGGA ATCGGTGGAC 
CGTCTCGGCC AGGCTTTCGA CACCGAATGG CGCTCCGCGG CGGAGCGGTG GCGTGGCGCG 
GGCGCGGTGG TACTCCATGA CGAGCTGCGC CGGATCCTCA CCGCAGCCGC CTGCGAATGG 
GCCGGAGTGC CGGCAGACCA GGCTACAGTG GGCCGCCGCG CCCGGGAACT GAGCCTGATG 
ATCGAAAAGG CCGGCGCGGT CGGGCCGGCG AACTGGTATG CGCGGTGGCG CCGCCGCGGA 
ACCGAAAAAT GGGCCGCCGA CTGCCTCGAC ACCATCCGCC GGTCCGGCCC GGACGCGGCC 
AGGGACACGC CGGCCGCGTC GATCGCCTTT CACACCGACG AACACGGCAA CGCACTCCCG 
GTTGACACCG CGGCGGTGGA ACTTCTCAAC CTGCTCCGGC CCATCGAGGC CGTCAGCCGC 
TTCATGGTCT TCGCAGCCGT CGCCCTGCAG CAGCACCCCG AATGGAAAGA CATCCTGAAC 
GCAGGCCAGG ACGCAGACCT GGACTGCTTC GCACAGGAAG TCCGCCGGTA TTACCCGTTC 
TTCCCCTTCG TCGGCGGCAC GGCCCGCCAA CCACTGCAAT GGAAGGGCCA GACATTCAAA 
GAGGGTCAAT GGGTGCTGCT GGATCTGTAC GGCACGAACC ACGACGGCCG GATCTGGAAG 
GATCCGGAGA GCTTCGACCC TGCCCGGTTC CGCGCCTGGC GGCCGGACCC CCACACCCTG 
GTTCCCCAGG GCGCCGGCGA CCCTGCCGCG GGGCATCGCT GCCCCGGTGA GGACATCACC 
GTTGACCTGA TGCGGCGGGC CGTCCGGGCA CTGGCCGCGG AGACCGGCAT GAGCGTACCC 
GCCCAGGACC TGAGCATCGA CCTTACCCGG ATGCCCGCGC TGCCTCGAAG CGGTTTCATC 
CTCTCAGGAC GCCCCGGACC GCACTGA

Protein sequence

MPRSAQHLLQ DAGSVQSLEG PAHRHRKQLF RDLMTKESVD RLGQAFDTEW RSAAERWRGA 
GAVVLHDELR RILTAAACEW AGVPADQATV GRRARELSLM IEKAGAVGPA NWYARWRRRG 
TEKWAADCLD TIRRSGPDAA RDTPAASIAF HTDEHGNALP VDTAAVELLN LLRPIEAVSR 
FMVFAAVALQ QHPEWKDILN AGQDADLDCF AQEVRRYYPF FPFVGGTARQ PLQWKGQTFK 
EGQWVLLDLY GTNHDGRIWK DPESFDPARF RAWRPDPHTL VPQGAGDPAA GHRCPGEDIT 
VDLMRRAVRA LAAETGMSVP AQDLSIDLTR MPALPRSGFI LSGRPGPH