Gene Dshi_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1039
Symbol
ID	5711007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	1071506
End bp	1072714
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	69%
IMG OID	641266950
Product	monooxygenase FAD-binding
Protein accession	YP_001532382
Protein GI	159043588
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.460547
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCATA TCGTTGTCAT CGGGGCCGGG CCGGTCGGCA CGTCGCTGGC GCTGGCGCTG 
CTGCGTGCCG GGCTGGACGT GACGCTCTGC GAGCAGGCCG AGAGCCTGCC GGCCGATCCG 
CGCGCCGCCA CCCTGCAACC GCCGACGCTG GAAATGCTCG ACGCCTTGGG CAGCGGCGCT 
GCGATCCGCG CCAAGGGGCT GAAGGCGCCG GTCTTCCAGT TCCGCGACCG GGCCTCCGAC 
AGCATCATCG CGGAGTTCGA CTATGGCCTG CTGGAGGGAG AGACCCCCCA CCCCTTCGCC 
CTGCAATGCG AGCAGTTCAA GGTGGCCGAC ACCAATGCCG AGGCGATCGA GGCCCTGCGC 
CCCGGCACCC TGCGGCTCGG CACCGCCGTC ACCGGCTTTG CCCAGGACGG CGACGGTGTG 
GACGTGACCC TGAGCACCGG CGAGACCCTG CGCGCCGACT ACCTCGTGGG CTGCGACGGG 
GGGCGGAGTG CGACGCGCAA GGGGCTGGGC ATCGCGTTCG AGGGGTTCAC CTACGAGGAA 
CGCTTCCTCG TGCTGACCAC GCCCCATGAC TTCTTCGCCC GCGACTTCCG GGTGCGCAAC 
TACGTGCTGG ACCCGAGCCA GTGGTGTGCG CTGTTCAAGG TGCCCCATGA CGGCCCGCCG 
GGCCTGTGGC GCATCGTGTT CCCCGCCCCC GCCGCCGACA GTGGCACGGA TGCGCTCTCG 
GATGCCTATG TCAGTGCGCA GATGCTCGGG CTGGAGCCTG CGCTGGGGTT GGCCGACATC 
ACCCATCGCA ACATCTATGC GGTCAACCAG CGGGTCGCGG CGGCGTTTCG CAAGGGGCGG 
GTGTTTCTCG CGGGGGATGC GGCGCATGTT AACAATCCGC TCGGCGGGCT GGGCATGAAC 
TCGGGCATCC ATGACGCGGT GAACCTCGCG GACAAGATCG CCCGCGCCGT GGCCGACCCG 
GGCAAGGCCG AAACCCTGTT CGGTGCCTAT GACGCCGAGC GGCGGCAGAT CGCCAAGGAG 
TACGTGCAGG CCCAGACGAT CCAGAACAAG AAACGCCTGG AGGCCCGGAC CCCCGAACAA 
CAGGCCGCCG CCCGCGCGGA GTTGCAGGGC ACCTGCGCCG ATCCCGCCCG GCACAAGGCC 
TGGGTGATGA ACGCGTCGCT GCTGACCGGG TTGCGGCAGC TCGAAGACCA AGGAAGGAAA 
GCCCCATGA

Protein sequence

MTHIVVIGAG PVGTSLALAL LRAGLDVTLC EQAESLPADP RAATLQPPTL EMLDALGSGA 
AIRAKGLKAP VFQFRDRASD SIIAEFDYGL LEGETPHPFA LQCEQFKVAD TNAEAIEALR 
PGTLRLGTAV TGFAQDGDGV DVTLSTGETL RADYLVGCDG GRSATRKGLG IAFEGFTYEE 
RFLVLTTPHD FFARDFRVRN YVLDPSQWCA LFKVPHDGPP GLWRIVFPAP AADSGTDALS 
DAYVSAQMLG LEPALGLADI THRNIYAVNQ RVAAAFRKGR VFLAGDAAHV NNPLGGLGMN 
SGIHDAVNLA DKIARAVADP GKAETLFGAY DAERRQIAKE YVQAQTIQNK KRLEARTPEQ 
QAAARAELQG TCADPARHKA WVMNASLLTG LRQLEDQGRK AP