Gene RPD_1972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1972
Symbol
ID	4022454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2210219
End bp	2211691
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	56%
IMG OID	637962165
Product	DNA-cytosine methyltransferase
Protein accession	YP_569108
Protein GI	91976449
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0825702
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.570166
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCACG CTCTGTTGCA GCGTGTCGAG ATCTCGGAAA CGGATGGGAT GCGAGGGGCA 
GACGGTTTAT CGGTGGAGCT GCGGGTCGCT TCGTTGTTTG CGGGAATCGG AGGGTTCGAC 
AAAGCTTTTG AATCGGTCTC AGCCTCCGTG GTCGCCCAGT GCGAGATTGA CTCCTTCTGC 
CGCGCCGTAC TCAGGCGACA TTGGCCACAG ACTAAGCTTT TCGAAGATAT TACCAAGATC 
AACCCAGCCG AATTTCCAGC GGCCGACATT TGGACCGCAG GCTTTCCCTG CCAAGATGTT 
TCGCTCGCGC GCGGTAACCA CGGTCGAGAT GGGCTCAAAG GCAATCACAC GAGTCTTTTC 
TTTAAGTTGA TGGATCTGGC CGAGGCTAAG AAGCCTAAGA TCATCCTGCT TGAAAACGTC 
GTTGGCCTAC TCAATTCACA TCAGGGTTGT GATTTTGCAA TCATCTTGCG TGAGCTAACT 
AATCAAGGAT ACGCCGTTTC TTGGCGTGTT CTGAATGCCC GTTACTTCGG CTCACCGCAA 
TCGAGATCGC GCGTCTTTAT GGTGGCTTGG CGCGGCGACT ACAGGTTGGC GCTTGCGTCC 
CTTTTCGAGC CGGTACGTGG TGCGAAGACG GCGGCCGAAC GCAAGGGATT TGTGACAAAG 
ACGACGCATG CAAAGACCGG AGCGATTGTG CCTCAGGTCG CATATTGTGT CGCTGCAACG 
TCGGGTAGGC ACACCGGAAA CGATTGGGCG CGTTCCTATA TTTCCTACAA GGATCGTGTC 
CGCAGGCCGA CTGTGAGCGA AAGCGAGCGT TTGCAAGGTT TCGAAGCCGG GTGGACTGTG 
CCTGGCGCTG GCTACCGCGA ACCCGCGCGC GGTTTCGATT CCGAGCGCTA CCGCGCGGTC 
GGTAATGCAG TCGCGGTGCC TGTGGTCAGG TGGATCGCTC AGCGAATGAC AGCGGCGCTA 
GCGCAGCCGA AAGCCCCATC AAGCCGCCGT GGTTTTATGG AGGAGTGCTT GCTCATCGCG 
CCCGATCTTG CGAACTCGAC GGAGACACTT CGCTTTTCAG ACATTATGGA GGAGGTCAAC 
AAGGGGGAAT TCGTCTACCG CTGGAAGGGC TGCGGCGTCG CCTGGGGTAA CAATATTGTC 
GAAGGAGCTA CCGCTCCCGC TCCGTCGCAA GTCGTAGACT CGCGCTTTGT CAATTTGCTT 
GACAATGAAG TGCCTGACGA CCGCTATTTT CTCACTCCTA ACGCTGCCAT CGGCATTTTG 
AGGAGGGCGG ATTCGGTTGG CCGAACGCTG TTCGGACCGA TGCGTGAAGC ATTGGAAAAT 
ATGGTAAAAT GCTTCTCTGC TGCGGATTCG CCGCGGGTTT TAGCCGGAGA GCAGATTGCC 
AAGGTCAGCA TTCGTCCGCC TCGCACAAAC AAGCGCGGCA ATTCTCAACT CGATCGCTCA 
ATTGCCGTCA GGGCCACACG CATCTCCTAT TAA

Protein sequence

MNHALLQRVE ISETDGMRGA DGLSVELRVA SLFAGIGGFD KAFESVSASV VAQCEIDSFC 
RAVLRRHWPQ TKLFEDITKI NPAEFPAADI WTAGFPCQDV SLARGNHGRD GLKGNHTSLF 
FKLMDLAEAK KPKIILLENV VGLLNSHQGC DFAIILRELT NQGYAVSWRV LNARYFGSPQ 
SRSRVFMVAW RGDYRLALAS LFEPVRGAKT AAERKGFVTK TTHAKTGAIV PQVAYCVAAT 
SGRHTGNDWA RSYISYKDRV RRPTVSESER LQGFEAGWTV PGAGYREPAR GFDSERYRAV 
GNAVAVPVVR WIAQRMTAAL AQPKAPSSRR GFMEECLLIA PDLANSTETL RFSDIMEEVN 
KGEFVYRWKG CGVAWGNNIV EGATAPAPSQ VVDSRFVNLL DNEVPDDRYF LTPNAAIGIL 
RRADSVGRTL FGPMREALEN MVKCFSAADS PRVLAGEQIA KVSIRPPRTN KRGNSQLDRS 
IAVRATRISY