Gene RPD_1200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1200
Symbol
ID	4021676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1358425
End bp	1359558
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	64%
IMG OID	637961392
Product	DNA methylase N-4/N-6
Protein accession	YP_568339
Protein GI	91975680
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTTGT CGCGTAGCGG GGCGTCTGCA AGGGCGCCCC GCACTCAATT CGAATACCTC 
CCGGAGAACC GGATCATCGT CGGCGATTGC GTCGCCGAGA TGTCGAAGCT TCCGGCCCGC 
TCGGTCGATC TGGTGTTCGC AGATCCGCCG TATAATTTGC AGCTCAAGGG CGAGCTGAAA 
CGTCCCGACG AATCGCACGT CGATGCGGTC GACAACGATT GGGACAAGTT CTCATCCTTC 
GCCGCTTACG ATGATTTCAC CCGCGCCTGG CTGCTCGCCG CGCGCCGGAT CATGAAGCCG 
TCGGCGACGA TCTGGGTGAT CGGCTCCTAT CACAACATCT TCCGCGTCGG CGCGATCATG 
CAGGACCTCG GGTTCTGGCT GCTCAACGAT ATCGTCTGGC GCAAGACCAA TCCGATGCCG 
AATTTCCGCG GCCGCCGATT CACCAACGCC CACGAGACGA TGATCTGGGC GGCGCGCGAC 
GAGAACGCCA AGGGCTACAC TTTCAATTAC GACGCGCTGA AGGCCGCCAA CGAGGACGTT 
CAGGCGCGCT CCGACTGGCT GATTCCGCTG TGCACCGGCG AGGAGCGGCT GAAGGGCAGC 
GACGGCAAGA AGGTGCATCC GACCCAGAAG CCGGAAGGCC TGCTGGCGCG TGTGCTGCTG 
TCGTCGTCGA AGCCCGGCGA TCTGGTGATC GATCCGTTCA ACGGCACCGG AACCACCGGC 
GCCGTCGCCA AGCGGCTGCG CCGCAACTAC ATCGGCTTCG AGCGCGACCG CGACTATGCC 
ACCGCTGCGG AAGCGCGGAT TGCCGCGATC GAGCCGCTGC CGGAAGCCAC ATTGGCGCCG 
TTCATGACCG CGCGCAGCGC GCCGCGGGTC GCGTTCGCCG AACTGATCGA ACGCGGAATC 
ATTTCGCCCG GGACCAAGCT GGTCGATTCG AAGAAGCGGC ACGGCGCGCT GGTCCGTGCC 
GACGGCGCGA TCATGCTCGG CGACAAGGTC GGCTCGATTC ACCGCATCGG CGCGGTGGCG 
CAAGGCTCAG AGGCCTGCAA CGGCTGGACG TTCTGGCATG TCGAGACCAG CAAGGGCCTG 
CGCCTGATCG ACGAACTCCG CGCCGAAATC CGCAGCGCCA TGGCTGCTGG CTAA

Protein sequence

MILSRSGASA RAPRTQFEYL PENRIIVGDC VAEMSKLPAR SVDLVFADPP YNLQLKGELK 
RPDESHVDAV DNDWDKFSSF AAYDDFTRAW LLAARRIMKP SATIWVIGSY HNIFRVGAIM 
QDLGFWLLND IVWRKTNPMP NFRGRRFTNA HETMIWAARD ENAKGYTFNY DALKAANEDV 
QARSDWLIPL CTGEERLKGS DGKKVHPTQK PEGLLARVLL SSSKPGDLVI DPFNGTGTTG 
AVAKRLRRNY IGFERDRDYA TAAEARIAAI EPLPEATLAP FMTARSAPRV AFAELIERGI 
ISPGTKLVDS KKRHGALVRA DGAIMLGDKV GSIHRIGAVA QGSEACNGWT FWHVETSKGL 
RLIDELRAEI RSAMAAG