Gene Rpal_3803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3803
Symbol
ID	6411481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4082080
End bp	4083780
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	51%
IMG OID	642713684
Product	Site-specific DNA-methyltransferase (adenine-specific)
Protein accession	YP_001992777
Protein GI	192292172
COG category	[L] Replication, recombination and repair
COG ID	[COG2189] Adenine specific DNA methylase Mod
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAGAA AAACGCGCCT AGAACTAACC TGGATCGGTA AGGATGAGCG GCCGCGGCTG 
GAGCCGAGAA TATTGATGGA AGATATTGCA CTATCACATC ATGCGTCGGT GCGGCATTCT 
GAGGCGGACA TCTTCGATAA TCTGCTGATC CAAGGCGACA ATCTATTGGC CCTCAAGGCG 
CTCGAAGCAA GCTACACGGG CAGGATCAAG TGCGTCATTA TCGACCCGCC ATATAATACG 
GGTAGCGCAT TCAAGCACTA CGATGACGGT CTTGAGCACT CGCTATGGCT TTCGTTGATG 
CGTGACAGGC TCGACCTGAT TAGGCGCTTG ATGTCAGAAG ATGGATCGCT TTGGATCACA 
ATAGATGACA ATGAAGCTCA CTATCTGAAG ATTCTCTGTG ATGAAGTTTT CGGAAGGTCA 
AATTTTGTAG CGAACGTCGT TTGGCAGAAG AAGTATTCGA AGCAGAATGA TGCGAAGCAT 
TTCAGTACGA GCCACGACCA CATTCTTGTC TTTGCTAAGA ACAAGAATGA GTGGGCGCCA 
AACAAGGTTG GAAGAAACCA AAGTCAACTG AAAGGTTATA GCAATCCGGA CGATGATCCA 
CGCGGACTAT GGACGTCAGT CGTTTATACC TGTTCCAAGA CTCGCGCAGA ACGGCCCAAT 
CTGTTCTATC CAATAAAGCA CCCGGTTACG GACGTTGATG TTTGGCCAAG TGAAACCAGG 
GTCTGGGGCT ACGACGAGGC GCGCCATAAG AAGCACGTCG AAGAGAACAT GCTTTGGTGG 
GGCAAGAACG GCGAACAAGA AAAGCCGAGA ATAAAGGTGT TCTTATCCAA AGTAGGCGAA 
GGAGTTGTTC CTAGCACTAT CTGGCTTCGC GATGAAGTGG GAGACAATCA AGATGCGCGC 
CGTGAAGCGA TGGCGCTGAA TTCGGAAGGA TCTTTCTCTA CTCCGAAACC TGAGAGCCTC 
ATAAGACAAA TGGTCTCCAT CGCTACAGCT CCCGGCGATC TAGTTCTCGA TTCATTTGCA 
GGCTCCGGCA CCACCGGCGC CGTTGCACAC AAGATGGGGC GGCGCTGGAT TATGGTTGAG 
CTCGGGGACC ATGCAGTCAC GCACATTGTT CCGCGCCTCA AGTTGGTAAT CAACGGCGCG 
GACCGGGGTG GAGTCACCGA TGCGGTGGGC TGGAATGGCG GCGGTGGGTA TCGATTCTGT 
CGGCTCGCTC CTTCGCTTCT CGAAAAAGAT CGCTTTGACA ATTGGGTGAT AGCCAAAGAA 
TACAACGCCG CTATGCTTGC TGAAGCTCTA TGCAAGCATC TGGGTTTTAC CTATGCGCCT 
AGCCAGGACG CGGCCGAATA TTGGCGGCAC GGAAATTCGA CCGAGACCGA CTTCATCTAT 
GTCACTACTC AGTCACTGAC TTACGATGCT TTGAAGAAGT TGTCTGAAGA AGTTGGCCCA 
AAGCGGACGT TGCTGGTTTG CTGTAAAGCC TTCAATGCGA AGGAGGATAG CTTTCCGAAT 
CTTACGGTGA AAAAGATACC CCATGCAATT CTCGCGAAGT GCGAATGGGG TCGAGACGAT 
TATTCCCTTC AGATAGCCAG TCTTACAGAA GAGGTAAAGT CCAAGGATTC CAACGGCTCG 
GCTGACGATG GAGAAGAAAG GCCCCAACGC CGGAAGTCAA AAACACAATT GCCGCTCTTC 
GATTCGACGG AGGGTGAGTG A

Protein sequence

MNRKTRLELT WIGKDERPRL EPRILMEDIA LSHHASVRHS EADIFDNLLI QGDNLLALKA 
LEASYTGRIK CVIIDPPYNT GSAFKHYDDG LEHSLWLSLM RDRLDLIRRL MSEDGSLWIT 
IDDNEAHYLK ILCDEVFGRS NFVANVVWQK KYSKQNDAKH FSTSHDHILV FAKNKNEWAP 
NKVGRNQSQL KGYSNPDDDP RGLWTSVVYT CSKTRAERPN LFYPIKHPVT DVDVWPSETR 
VWGYDEARHK KHVEENMLWW GKNGEQEKPR IKVFLSKVGE GVVPSTIWLR DEVGDNQDAR 
REAMALNSEG SFSTPKPESL IRQMVSIATA PGDLVLDSFA GSGTTGAVAH KMGRRWIMVE 
LGDHAVTHIV PRLKLVINGA DRGGVTDAVG WNGGGGYRFC RLAPSLLEKD RFDNWVIAKE 
YNAAMLAEAL CKHLGFTYAP SQDAAEYWRH GNSTETDFIY VTTQSLTYDA LKKLSEEVGP 
KRTLLVCCKA FNAKEDSFPN LTVKKIPHAI LAKCEWGRDD YSLQIASLTE EVKSKDSNGS 
ADDGEERPQR RKSKTQLPLF DSTEGE