Gene TM1040_0561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0561
Symbol
ID	4077912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	597039
End bp	598208
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	59%
IMG OID	638005858
Product	4-hydroxybenzoate 3-monooxygenase
Protein accession	YP_612556
Protein GI	99080402
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID	[TIGR02360] 4-hydroxybenzoate 3-monooxygenase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.061935
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.130471
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACAC AGGTTGTAAT TGTTGGTGGC GGCCCATCAG GAATGCTGCT GGGACAGCTT 
TTGCACCTCA ATGGCATCGA CACCATCGTC CTGGAACGAC GGACCAAGGA GCATGTGCTC 
AGCCGCATTC GCGCCGGCAT CCTCGAGCAG GGCTTGGTTG AGCTGATGCA TAAAGCAGGC 
GTCGGTGCGC GGCTCGAGCG CGAGAGCTTT CGCCATCACG GGACATTGAT TTCACACAAT 
GACGAGATGT TCGGCATAAA TTTTGAGCGC CTGATCGGTA AATCGGTGAC GCTATATGGC 
CAAACCGAGG TGACCCGCGA TCTCTATGAG GCGCGCGAAA GCGTTGGCGC GACCACGTTT 
TTTGACGTCG AAGATGCCAC AATCCACGAT GCTGACACCG AGAGCCCCTA TGTCACCTTT 
CAAAAGGACG GCAAAGAGAC TCGCATCGAT TGCGATTTCA TCGCGGGCTG CGACGGGTTT 
CATGGTGTCA GCCGACGCAC GATCCCGGCC TCTGTCCGCA CGGAATACGA AAAAGTCTAT 
CCCTTTGGCT GGCTCGGCAT CCTGTCCGAA ACCCCGCCCG TCAATGAGGA GTTGATCTAC 
GCCAATTCAG AGGACGGGTT CGCGCTCTGT TCGATGCGCA ACGCCAATCT CAGCCGCTAT 
TACGTTCAAT GCTCTCTGGG CGATGACGTG GGCGATTGGA CAGATACCCG GTTCTGGGAC 
ACCCTGCGCC GCCGCCTGCC GAGCGAGGTC GCAGAGGCCC TGGTCACAGG CCCCTCGATC 
GAGAAGTCCA TCGCACCGCT GCGCTCGTTT GTGAGCGAGC CAATGCGCTG GGGGCGGCTG 
TTCCTCTGCG GCGATGCGGC TCATATCGTG CCGCCAACCG GGGCGAAGGG TCTGAATACT 
GCCGCCTCGG ACGTGCATTA CCTCTACACG GGATTGATCC AGTATTATGA GGACAAAGAC 
AGCGAAGGGA TCGATCGCTA CTCCGAAAAA GCCCTCGCCC GTGTTTGGAA GGCGGAGCGG 
TTCAGCTGGT GGATGACGTC CTTGCTGCAT CGGTTCCCCG ACCAAGGTCC GTTTGACGTA 
AAGATGCAGG CGGCAGAACT GGCGTTCCTG CGCGACAACA AGGACGCGCA ACGCGTGCTT 
GCCACCAACT ATGTCGGGCT GCCTTACTGA

Protein sequence

MRTQVVIVGG GPSGMLLGQL LHLNGIDTIV LERRTKEHVL SRIRAGILEQ GLVELMHKAG 
VGARLERESF RHHGTLISHN DEMFGINFER LIGKSVTLYG QTEVTRDLYE ARESVGATTF 
FDVEDATIHD ADTESPYVTF QKDGKETRID CDFIAGCDGF HGVSRRTIPA SVRTEYEKVY 
PFGWLGILSE TPPVNEELIY ANSEDGFALC SMRNANLSRY YVQCSLGDDV GDWTDTRFWD 
TLRRRLPSEV AEALVTGPSI EKSIAPLRSF VSEPMRWGRL FLCGDAAHIV PPTGAKGLNT 
AASDVHYLYT GLIQYYEDKD SEGIDRYSEK ALARVWKAER FSWWMTSLLH RFPDQGPFDV 
KMQAAELAFL RDNKDAQRVL ATNYVGLPY