Gene Arth_4042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4042
Symbol
ID	4447878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4561769
End bp	4562800
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	69%
IMG OID	639691873
Product	monooxygenase, FAD-binding
Protein accession	YP_833517
Protein GI	116672584
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACGGCA TAACAATCGT GGGCGGGGGC ATCGCCGGGC TGGCCCTCGC CGCGACGCTT 
GATCCGGGTC GCTTCCACGT CACGGTGCAC GAGCAGCGGA ACACGCTGCC GACAGTTGAA 
ACGTCCCTGG CCATGTGGCC GGAGGCCCAG AAGGCGCTCG GCGCCGTGGG GATCCTGCCG 
CAGATTCAGG CGGCAGGCTC CGCCTTTGAC GCCATGGCAC TGCGGGACGT GTCCGGGAAG 
GCGTGGTTCC GGGCCGCGGT TGCAGGCGTG ATCGGCGTTT CACGCGCTGA CCTGCTTCGC 
CTCCTGGACT CTGCCGTGCC GCAGTCCGTG ACCCGGGTGT CCGGTGCGGT GACCGCGTTT 
CCCGACTCAG GGCTCCTGGT GGGAGCCGAC GGCGTCCACA GTGTGGTCCG CCGGCAACGG 
TGGGGCTCGC GGTCCCTGGA ACGGCTCAGT CCCTACCTCG CCTTGCGCGG GATCATCGAT 
GAACCTGTCG CCGGGGATAC GGCTGGCGAA TACTGGGGCC GCGGTGAATT GTTCGGCATC 
GCTCCGGCAT CCCGGCAACG GACCTACTGG TACGCGTCCT ACCGGTCGGA CCTGGGGCCC 
GGCGGCGTCG ATATCGCCGC GGCACTGGAT CTCACCCGCC GGCGCTTTTC AGGAAAGGCT 
CCGGGAATCG TTCGCGTTCT CGCCGGGGCA GCCCCCGAAG GGACGCTCGC CCAGCGGATC 
TGGACAGTGC CCGCCCTCGG GCACTACGCA CGCGGGGGCA CCGCGCTGGT GGGAGACGCG 
GCGCACGGCA TGACGCCTAA CCTTGGACGC GGGGCCTGCG AGGCCCTGGT TGATTCGGTT 
ACCCTCGCCG GGCTGCTCAA CTCGCGGCCG CTTCCGGAGG CGCTCGCGGC CTACAATAAG 
CGGCGCGTGC TTCGCAGCCA GGCCTTACGG GTGGCGTCTT CCGCGATGAC CCGGCTTGTG 
CTTGACGAAT CGGCCCAGCC GTTCCGGGAC AGGATTCTCA GCGTCGCCGG GCGGCTGAGC 
CGCACCGCTT AG

Protein sequence

MYGITIVGGG IAGLALAATL DPGRFHVTVH EQRNTLPTVE TSLAMWPEAQ KALGAVGILP 
QIQAAGSAFD AMALRDVSGK AWFRAAVAGV IGVSRADLLR LLDSAVPQSV TRVSGAVTAF 
PDSGLLVGAD GVHSVVRRQR WGSRSLERLS PYLALRGIID EPVAGDTAGE YWGRGELFGI 
APASRQRTYW YASYRSDLGP GGVDIAAALD LTRRRFSGKA PGIVRVLAGA APEGTLAQRI 
WTVPALGHYA RGGTALVGDA AHGMTPNLGR GACEALVDSV TLAGLLNSRP LPEALAAYNK 
RRVLRSQALR VASSAMTRLV LDESAQPFRD RILSVAGRLS RTA