Gene Smed_4202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4202
Symbol
ID	5319097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	683419
End bp	684591
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	63%
IMG OID	640776007
Product	4-hydroxybenzoate 3-monooxygenase
Protein accession	YP_001312940
Protein GI	150376344
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID	[TIGR02360] 4-hydroxybenzoate 3-monooxygenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACTC AGGTCGTCAT AATCGGCTCC GGACCTTCCG GGCTCCTACT CGGACAACTG 
CTTGCGAGGG CGGGGATAGC AAATGTGATC GTCGATCATG CGAGCAAGGA TCATATCCTC 
GGCCGTGTGC GCGCCGGCGT TCTGGAGGAA GGGACGGTCC GGCTGATGGA CGAGGCGGGC 
TCAGGCGCCC GCATGCATGC CGAAGGCATT GCGCATGACG GCTTCTCGCT TGCCTTCGAC 
GGGCGCGATC ATCGAATCGA CCTCTTCGGG CTCACGGGCG GCAGACGGGT GATGATCTAC 
GGTCAGATGG AACTCACCCG CGACCTGATG GATCAGCGGG AAAGGGCCGG CGCCCCCTCG 
GTCTACGAGG CGGAAAGTGT CACCCCCCGC GATTTCGAAG GGGATGCGCC CCATGTCGCC 
TACCGTAAGA ACGGGATTGC GCACCGCATC GACTGCGACT TCATCGCCGG CTGCGACGGG 
TTTCATGGCG TCAGCCGCCG TTCGGTGCCG CAAAATGCCT TTCGCAGCTT CGAAAAGGTC 
TACCCATTCG GCTGGCTCGG TATCCTTGCC GACGTACCGC CGGTCGACGA TGAACTGGTC 
TATGCCAATC ATCCCCGCGG CTTCGCGCTC TGTTCGATGC GATCTCATAC GCGCAGCCGC 
CACTATATTC AGTGCCCGCT CGGCGAGAAG ATCGGCGACT GGAGCGATCA ACGCTTCTGG 
GACGAACTGC GCCGCCGCTT GCCGGCCCAT CATGCCGAAC GGGTGGTGAC GGGACCTTCC 
TTCGAAAAAT CGATCGCCCC GCTGCGTTCC TTCGTCGCCG AGCCGATGCG CTTCAACCGG 
CTGTTTTTGG CGGGTGATGC CGCGCATATC GTTCCGCCCA CCGGCGCCAA GGGCTTAAAC 
CTGGCGGCAA GCGACGTGCA CTATCTCTTC GAGGCATTTG TCGAGCACTA TCAGGACCGC 
TCGAACGCCG GCATCGACGC CTATTCGGCC CGCGCTCTCG CCCGCGTCTG GAAGGCCGTA 
CGCTTCTCCT GGTGGATGAC GACGATACTG CACCGCTTCC CGGAGACGAG CGAGTTCGAC 
CAGAAGATCC AGGAGGCCGA ACTCGCCTAT CTCACCCACT CGAGCGCGGC CGCGACCGCG 
CTCGCGGAGA ACTATGTCGG CCTGCCTTTC TGA

Protein sequence

MRTQVVIIGS GPSGLLLGQL LARAGIANVI VDHASKDHIL GRVRAGVLEE GTVRLMDEAG 
SGARMHAEGI AHDGFSLAFD GRDHRIDLFG LTGGRRVMIY GQMELTRDLM DQRERAGAPS 
VYEAESVTPR DFEGDAPHVA YRKNGIAHRI DCDFIAGCDG FHGVSRRSVP QNAFRSFEKV 
YPFGWLGILA DVPPVDDELV YANHPRGFAL CSMRSHTRSR HYIQCPLGEK IGDWSDQRFW 
DELRRRLPAH HAERVVTGPS FEKSIAPLRS FVAEPMRFNR LFLAGDAAHI VPPTGAKGLN 
LAASDVHYLF EAFVEHYQDR SNAGIDAYSA RALARVWKAV RFSWWMTTIL HRFPETSEFD 
QKIQEAELAY LTHSSAAATA LAENYVGLPF