Gene RPB_4003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4003
Symbol
ID	3911810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4569695
End bp	4570837
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	67%
IMG OID	637885907
Product	O-methyltransferase, family 2
Protein accession	YP_487607
Protein GI	86751111
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.414327
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000643794
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAACTCCT TGAGTCTGCG TGACCGGCTG CTCGGCTGGC GCGATTCAGT CTTGTCGAAC 
CCGCGGTTTC AGCGCTTCGC CGCGGTGTTT CCGCTGATGC GGCCTGTTGC GCGCCGCCGC 
GCCGCCGCGA TGTTCGACCT CGTCGCCGGC TTCGTCTATT CCCAGATCCT GCTCGCCTGC 
GTGCAGTTGC GGCTGTTCGA CCTGATCGCC GAACGGCCTG CCACCGTCGA CGAATTGTCG 
GTGCGATGCG AGCTGCCGCG CGAATCGATG CAGATGCTGC TCGATGCGGC GATCGCGCTG 
AAGCTGGTGC AGCCGCGCAG CGAAGGCCGC TATGGCCTCG GCCAGCTCGG CGCCGAACTG 
TGCGGCAATC GCGGCGTGCT GGCGATGGTC GAGCATCACG CGATGCTGTA TCGCGACCTC 
GCCGATCCGG TGGCGCTGCT GCGCGGCCCG CGCGGCGGCG GAGAACTCGC TGCTTACTGG 
GCCTATGTCC GCGGCGAGCG GCCGGCCGAG CTCGGTGCGG AGCACGTCGC GTCCTACACC 
GCGCTGATGG CCGCGTCGCA GCCGATGATC GCGCGCGAAG TGCTGCACGT GTTCTCGTTC 
GGCGCTCATC GTTGCCTGCT CGACGTCGGC GGCGGCGACG GCTCGTTCCT GTCGGCAGTC 
GCCGCGCAGA CCCCGGAGCT GCGCTGCATC CTGTTCGATC TTCCGGCCGT GGCCGCCAAG 
GCGGCCGACC GCTTCCGTAC CAATGGCCTG GCCGAGCGCG CGACCGCGAT CGGCGGCAGT 
TTCCGGACCG ACCCGCTGCC CGAAGGCGCC GATATCGTCT CGCTGGTGCG AGTCATCCAC 
GACCATGACG ACGAGGTCGT CGCCGCGCTG TTGCGAGCGG TCCACAGCGC CCTTCCCGAG 
CGGGGGACAC TGCTGATCGC CGAGCCGATC GCCGGCCTGT CGCGTACCGC GTCGATCTCG 
GACGGCTATT TTGCCTTTTA TTTGAGGGCA ATGGGAACCG GTAAAGCCAG GACCTTCGAA 
CATCTCCGAT CGCTGCTGGA GGCCGCCGGA TTCGCTGAGA TCAAGCTCCA CCTGGTTCCG 
ATGCCACTGG TCGCCTCCGT AATTACCGCA ACCAAGACCT CCAAATGTGT TAATCTGGCT 
TGA

Protein sequence

MNSLSLRDRL LGWRDSVLSN PRFQRFAAVF PLMRPVARRR AAAMFDLVAG FVYSQILLAC 
VQLRLFDLIA ERPATVDELS VRCELPRESM QMLLDAAIAL KLVQPRSEGR YGLGQLGAEL 
CGNRGVLAMV EHHAMLYRDL ADPVALLRGP RGGGELAAYW AYVRGERPAE LGAEHVASYT 
ALMAASQPMI AREVLHVFSF GAHRCLLDVG GGDGSFLSAV AAQTPELRCI LFDLPAVAAK 
AADRFRTNGL AERATAIGGS FRTDPLPEGA DIVSLVRVIH DHDDEVVAAL LRAVHSALPE 
RGTLLIAEPI AGLSRTASIS DGYFAFYLRA MGTGKARTFE HLRSLLEAAG FAEIKLHLVP 
MPLVASVITA TKTSKCVNLA