Gene Rpal_4139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4139
Symbol
ID	6411823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4434412
End bp	4435455
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	65%
IMG OID	642714021
Product	Vanillate monooxygenase
Protein accession	YP_001993110
Protein GI	192292505
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.105569
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGCCT TTCCGCTCAA CGCCTGGTAT GCGGCGGCCT GGGACGCCGA CATCAAGCAC 
GCGCTGTTTC CGCGCACGAT CTGCGGCAAG CATGTCGTGA TGTATCGAAA GGCGGACGGG 
AACGTCGCTG CTCTTGAGGA CGCCTGCTGG CATCGCCTGG TGCCTCTGTC GAAAGGCCGG 
CTCGAAGGCG ACACCGTCGT CTGCGGTTAT CACGGGCTGA AGTTCAATCC GCAGGGCCGC 
TGCACCTACA TGCCGTCGCA GGAGACGATC AATCCGTCGG CCTGCGTGCG CTCCTATCCG 
GTGGTCGAGC GGCATCGCTT TGTCTGGCTG TGGATGGGCG ATCCGGTGCT GGCCGATCCG 
GCGCTGGTCC CCGACATGCA CTGGAACGAC GATCCGGCCT GGGCCGGCGA CGGCAAGACG 
ATCTACGCCA AATGCGACTG GCGCCTCGTC GTCGACAATC TGATGGACCT CACCCACGAG 
ACCTATGTAC ACGGCTCGTC GATCGGCAAC GAGGCGGTGG CCGAAGCGCC GTTCGATGTC 
ACGCACGGCG ACCGCACCGT CACCGTGACA CGCTGGATGA AGGGCATCGA ACCGCCGCCG 
TTCTGGGCCG CGCAGCTCGG CAAGCCCGGC CTGGTCGATC GTTGGCAGAT CATCCGCTTC 
GAGGCGCCCG GCACCGTGAC GATCGATGTC GGCGTGGCGC CGGCCGGCAC CGGCGCGCCG 
GAAGGCGACC GCTCGCAGGG CGTCAACGGC TTCGTGCTCA ACACCATGAC GCCGGAAACC 
GACACCACCT GTCACTACTT CTGGGCTTTC GTGCGCAACT ATCGGCTCAG CGACCAGCGC 
CTCACCACCG AGATCCGCGA AGGCGTCTCC GGCATCTTTC GCGAGGACGA AATCATCCTC 
GAAGCGCAGC AGCGCGCGAT GCTCGAGAAC CCGGACCGGG TGTTCTACAA TCTCAACATC 
GACGCCGGCG CGATGTGGTC GCGCAAGCTG ATCGACCGCA TGGTCGCGCA GGAAAGCGCG 
CCAAAGCTGC AGGCGGCGGA GTAA

Protein sequence

MPAFPLNAWY AAAWDADIKH ALFPRTICGK HVVMYRKADG NVAALEDACW HRLVPLSKGR 
LEGDTVVCGY HGLKFNPQGR CTYMPSQETI NPSACVRSYP VVERHRFVWL WMGDPVLADP 
ALVPDMHWND DPAWAGDGKT IYAKCDWRLV VDNLMDLTHE TYVHGSSIGN EAVAEAPFDV 
THGDRTVTVT RWMKGIEPPP FWAAQLGKPG LVDRWQIIRF EAPGTVTIDV GVAPAGTGAP 
EGDRSQGVNG FVLNTMTPET DTTCHYFWAF VRNYRLSDQR LTTEIREGVS GIFREDEIIL 
EAQQRAMLEN PDRVFYNLNI DAGAMWSRKL IDRMVAQESA PKLQAAE