Gene TM1040_3027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3027
Symbol
ID	4076600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	3195735
End bp	3197261
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	60%
IMG OID	638008356
Product	2-octaprenylphenol hydroxylase
Protein accession	YP_615021
Protein GI	99082867
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID	[TIGR01982] 2-polyprenylphenol 6-hydroxylase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.272776
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGGAC CTCACAACAT CATTCGCCTG ATCCGAACGG GAGCCACCTT GGTGCGCACC 
GGTGCCATGA ATGTGGTGCT CGACGCCTTT GATGCACCCG CCCCGTTGCG CATGGTAGCC 
TATACGCTTG GCTGGCCGTT TCAGTGGCTG GGCTACAAAG GCGACCCGGA GATGCCGCCG 
GCGACGCGCG CCATCACGGC GCTTGGACCG GCTTACATCA AATTTGGCCA GGTTCTCTCA 
ACCCGCCCGG ATGTGGTCGG GGACGATATG GCGCGACAGC TGCGTGTCTT GCAGGACAAG 
CTCCCGCCCT TCCCGCGCGA AGTCGCAATG GCCGAAGTGG CCAAGGAACT CGGTCGCCCG 
GTTGACGAGA TCTTTTCGGA GTTCTCGGAA CCCATCGCCG CCGCTTCGAT TGCACAGGTT 
CACCGGGCAC GTCTGAAAGA AACAGGCCAA GATGTCGCGG TCAAAGTCCT GCGCCCCGGC 
ATCGAGCGCG CCTTTCACAA GGATGTCGAC GCCTTTTATT TTGCAGCCCG GATCGCGGAA 
CTCTTTGCCC CCGGTGCGAA ACGTCTGCGC CCCATGGATG TGATCACCCA TTTTGATGGC 
GTGGTGCGTG GCGAACTGGA CCTGCGTCTC GAGAGCGCGG CTGCGTCGGA ATTTGCAGAC 
AACACCGCTG AGGATGCAGG ATTTCAGCTG CCGCCCGTCC TGTGGGATTA CTCCGCGCGT 
CGCGTCATGA CGCTGGGCTG GGCCGACGGG CTCCCGATAG GGGACAATGA TGCACTCGAC 
AGTGCTGGCC ATGATCGCCG CGCCCTGGGC GAGCGGGTTT TGTCCCTATT CCTGAACCAT 
GCTCTGCGCG ATGGTTACTT CCACGCGGAT ATGCATCAGG GCAATATGAA GGTCGCAGCC 
AATGGCGATA TCATCGCCTA TGACTTCGGC ATCATGGGGC ATATCGACCT CTACACCCGT 
CGGGTCTATG CAGAAATCCT CTATGGCTTC ATCAAGCGCG ACTACAAACG TGTGGCCGAG 
GTGCATTTCG AGGCGGGCTA TGTCCCCGCG AGCCAAGACG TTGACGAATT CGCACGCGCT 
CTGCGCGCCG TGGGCGAACC GATCTTCGGT ATGGATGCCA CCCATATCTC CATGGGGAGA 
TTGCTGAACT ACCTTTTTGA GGTCACAGAG CGTTTTGGAA TGGAAACCCG CACCGAGTTG 
ATCCTTTTGC AGCGCACCAT GGTGGTGGTG GAGGGCGTCG CCCGCTCGCT GGACCCGCGG 
ATCAATATCT GGGATGTCGC AAAACCCGTA GTCGAAGACT ACATCAAAGC CTCCATCGGC 
CCGCGCGCAA TCGCTGCTGA TCTGGGCAAG ACCGCCCGGG TTCTTGCCAG ATTTGGCCCG 
CGCTTGCCTA CTCTTGTCGA ACGCGCCTTG ATCGCACAAG CGCATGAGCC GGAGCCCCAA 
AACAAACGGC GGCCGTGGAA GCGCGCCGCT TCGGCAGGTG CCGCCCTTGG GATTCTGGCG 
ACGCTCCTTT TTACCCACCT AACATAA

Protein sequence

MRGPHNIIRL IRTGATLVRT GAMNVVLDAF DAPAPLRMVA YTLGWPFQWL GYKGDPEMPP 
ATRAITALGP AYIKFGQVLS TRPDVVGDDM ARQLRVLQDK LPPFPREVAM AEVAKELGRP 
VDEIFSEFSE PIAAASIAQV HRARLKETGQ DVAVKVLRPG IERAFHKDVD AFYFAARIAE 
LFAPGAKRLR PMDVITHFDG VVRGELDLRL ESAAASEFAD NTAEDAGFQL PPVLWDYSAR 
RVMTLGWADG LPIGDNDALD SAGHDRRALG ERVLSLFLNH ALRDGYFHAD MHQGNMKVAA 
NGDIIAYDFG IMGHIDLYTR RVYAEILYGF IKRDYKRVAE VHFEAGYVPA SQDVDEFARA 
LRAVGEPIFG MDATHISMGR LLNYLFEVTE RFGMETRTEL ILLQRTMVVV EGVARSLDPR 
INIWDVAKPV VEDYIKASIG PRAIAADLGK TARVLARFGP RLPTLVERAL IAQAHEPEPQ 
NKRRPWKRAA SAGAALGILA TLLFTHLT