Gene RPB_1073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1073
Symbol
ID	3908925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1232526
End bp	1233659
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	65%
IMG OID	637882966
Product	DNA methylase N-4/N-6
Protein accession	YP_484694
Protein GI	86748198
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.981822
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTTGT CGCGTCGCGG GGCGTCTGCA AGGGCGCCCC GCACTCAATT CGAGTCCGCT 
CCGGAGAATC GAATCATCGT CGGCGATTGC GTCGCCGAGA TGTCGAAGCT TCCGGCCAAA 
TCGGTCGATC TGGTGTTCGC CGATCCGCCG TACAATCTTC AACTCAAGGG CGCGCTCAAA 
CGCCCCGACG AATCGCAGGT CGACGCGGTC GACGACGATT GGGACAAGTT CTCGTCGTTC 
GCCGCCTATG ACGACTTCAC CCGCGCCTGG CTGCTCGCGG CACGCCGGAT CATGAAGCCG 
TCTGCGACGA TCTGGGTGAT CGGCTCGTAT CACAACATCT TCCGCGTCGG CGCGATCATG 
CAGGACCTCG GGTTCTGGGT GCTCAACGAC ATCGTCTGGC GCAAGACCAA CCCGATGCCG 
AATTTCCGCG GCCGCAGATT CACCAATGCC CACGAGACCA TGATCTGGGC AGCGCGCGAC 
GAGAACGCCA AGGGCTACAC CTTCAACTAC GACGCGCTGA AGGCCTCGAA CGAGGACGTC 
CAGGCACGCT CCGACTGGCT GATTCCGCTG TGCACCGGCG ACGAACGGCT GAAGGGCAAG 
GACGGCAAGA AGGTGCATCC GACGCAGAAG CCGGAAGGCC TGCTGGCGCG CGTGCTGTTG 
AGTTCGTCGA AGCCCGGCGA TCTGGTGATC GATCCGTTCA ATGGAACCGG CACCACCGGC 
GCCGTCGCCA AGCGTCTGCG CCGCAACTAC ATCGGCTTCG AGCGCGACCG CACCTATGCG 
GACGCGGCGC GGGCGCGAAT CGATGCGGTC GAACCGCTCC CGGAAGACAC GCTGAAACCG 
TTCCTCACCG CGCGCGACGC GCCGCGGGTG GCGTTCTCCG AACTGATCGA GCGCGGCATG 
ATCTCGCCGG GCGCCAAACT GGTCGACTCG AAGAAGCGCC ACGGCGCGCT GGTCCGCGCC 
GACGGCGCGA TCATGCTCGG CGACAAGGTC GGCTCCATCC ACCGCATCGG CGCAATGGCG 
CAGGGCTCCG AAGCCTGCAA CGGCTGGACC TTCTGGCACG TCGAGACCAC CAAGGGCCTG 
CGCCTGATCG ACGAACTGCG CGCCGAAGTG CGCAGCGCGA TGGCCGTCGG CTGA

Protein sequence

MILSRRGASA RAPRTQFESA PENRIIVGDC VAEMSKLPAK SVDLVFADPP YNLQLKGALK 
RPDESQVDAV DDDWDKFSSF AAYDDFTRAW LLAARRIMKP SATIWVIGSY HNIFRVGAIM 
QDLGFWVLND IVWRKTNPMP NFRGRRFTNA HETMIWAARD ENAKGYTFNY DALKASNEDV 
QARSDWLIPL CTGDERLKGK DGKKVHPTQK PEGLLARVLL SSSKPGDLVI DPFNGTGTTG 
AVAKRLRRNY IGFERDRTYA DAARARIDAV EPLPEDTLKP FLTARDAPRV AFSELIERGM 
ISPGAKLVDS KKRHGALVRA DGAIMLGDKV GSIHRIGAMA QGSEACNGWT FWHVETTKGL 
RLIDELRAEV RSAMAVG