Gene Rpal_1501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1501
Symbol
ID	6409159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1583161
End bp	1584702
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	64%
IMG OID	642711399
Product	N-6 DNA methylase
Protein accession	YP_001990514
Protein GI	192289909
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGACGG GCGAGTTGCG GTCGAAGATC GATAGGGTTT GGGATGCGTT TTGGGCTGGC 
GGGATCGCCA ACCCGATCGA GGTGATCGAG CAGATCACCT ATCTGCTGTT CATCCGCGGG 
CTCGACGAGG CGCACAGCCG CGAGGAGAAC AAGGCCAACC GGCTGAAGAA GCCGATGGCG 
CGGCGGATCT TCCCCGAGGG CAAGGACGGC ATCGGCAAAA AGGGCGGCGT GGCTTACGAG 
GACCTGCGCT GGTCGCGGCT GAAGAACCGC GATCCGGCGA CGATGTTCGA ACTCGGTTCC 
GAACACGTCT TCCCGTTCCT GCGCAACATG GCCGAGGAAG GCACCGCGCA CGCCACCCAC 
ATGAAGGGCG CGCGCTTCAC GATTCCGACG CCGGCGCTGT TGGCCAAGGT GGTCGACCTG 
CTCGCCGACA TCCCGATGGA GGATCGCGAC ACCAAGGGCG ATCTCTACGA ATACATGCTG 
GCGAAGATCG CCACCGCCGG CCAGAACGGC CAGTTCCGCA CTCCGCGCCA CATCATCGCG 
CTGATGGTGG AGATGACCGC GCCCACGCCG AAGGACGTGA TCGTCGATCC AGCCTGCGGC 
ACCTGCGGCT TCCTGGTCGC GGCCGGCGAA TTCTTGCGCG ACAATCACCC CAAACTGTTT 
CACGACGCCG AGAGCCGCGA CCACTTCAAT CAGGAGATGT TCCACGGCTT CGATTTCGAC 
GGCACCATGC TGCGGATCGG CTCGATGAAC ATGACGCTGC ACGGCGTCGA AGACCCCGAC 
ATCCGCTACA AGGATTCGCT CAGTCAGGAG CACGCGGGCG ACGAGGGGCG CTACAGCCTC 
GTGCTCGCCA ATCCGCCGTT CGCCGGCTCG CTCGATTACG AGACCACCGC GAAGGACCTG 
CTCGCCGTCG TCAAGACCAA GAAGACCGAG CTGCTGTTCA TGGCGCTGTT TCTGAAGCTG 
CTGAAACCCG GCGGGCGCGC GGCGGTGATC GTGCCGGACG GCGTGCTGTT CGGCTCCTCG 
ACCGCGCACA AGACGATCCG CAAGATGCTG GTCGAGAACC ATCGGCTCGA TGGAATCGTC 
AAGCTGCCGT CCGGCGTGTT CCGGCCCTAT GCCGGCGTCT CGACCGCGAT CGTGCTGTTC 
ACCAAGACCA ATTCGGGCGG CACCGACCAT GTCTGGTTCT ACGACTGCCA CGCCGACGGC 
CAGTCGCTCG ACGACAAACG CAGTTACCTG CTAACGGCCG ACAAGCTCGG CCCGAACGCC 
AAGCTCGACG AGGCTGAGCA CGCCAAGAAC AATCTGCCGG ACATCGCCGC GCGCTGGAAA 
CAGCGCGCGG GCACCGAGCG CGACCGCCCG CGCACCGCTC AGAGCTTCTG CGTGCCGAAA 
GCCGAGATCG AAGCGGCCGG CTACGACCTG TCGCTCAACC GCTACAAGGA AGTGGTGCAC 
GAAGCCGCCG AGCATCGGCC GCCGAAGGAG ATCATCGCCG AGCTAAAAGC GCTGGAGCAG 
GAGATCGCCG ACGGGCTGGA TGAGCTGGAG GCGATGCTGT GA

Protein sequence

MLTGELRSKI DRVWDAFWAG GIANPIEVIE QITYLLFIRG LDEAHSREEN KANRLKKPMA 
RRIFPEGKDG IGKKGGVAYE DLRWSRLKNR DPATMFELGS EHVFPFLRNM AEEGTAHATH 
MKGARFTIPT PALLAKVVDL LADIPMEDRD TKGDLYEYML AKIATAGQNG QFRTPRHIIA 
LMVEMTAPTP KDVIVDPACG TCGFLVAAGE FLRDNHPKLF HDAESRDHFN QEMFHGFDFD 
GTMLRIGSMN MTLHGVEDPD IRYKDSLSQE HAGDEGRYSL VLANPPFAGS LDYETTAKDL 
LAVVKTKKTE LLFMALFLKL LKPGGRAAVI VPDGVLFGSS TAHKTIRKML VENHRLDGIV 
KLPSGVFRPY AGVSTAIVLF TKTNSGGTDH VWFYDCHADG QSLDDKRSYL LTADKLGPNA 
KLDEAEHAKN NLPDIAARWK QRAGTERDRP RTAQSFCVPK AEIEAAGYDL SLNRYKEVVH 
EAAEHRPPKE IIAELKALEQ EIADGLDELE AML