Gene RPD_0359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0359
Symbol
ID	4020825
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	424666
End bp	425946
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	69%
IMG OID	637960544
Product	pseudouridine synthase RluD
Protein accession	YP_567498
Protein GI	91974839
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.0000104546
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGTCGCCG GCGGTGGCGG TGGCGACGAC GCGCGCCCCC TTCGGCAGCC GCAGCGTGGT 
CTCGGCGGCG ACCGGAACGC TTCCCTCGGA GCGGAAAAGC TTATAGCCGA TGGCGATGAG 
AACCGCCGCG AGCGCCAGCG CCGTGGTCAG GCCCGCGATC ATCATCATCC GCCGCACCCG 
CGCAAACAGC GCGGCCTGTT CGGGGGTCGG TTCGGGCAGG GCGGTTTCGG TCATGCAATG 
CTCGGTTTTG GCTCGGTTTT TTTGGAAGGC TCGATCGTGA ACGATTCGTC GGGACATCTG 
CTGGAAGTGG TCGTTGCCGG CGACGAGGGG TCGCCGCGGC TCGACCGGGT ACTGGCGACG 
CGGTGCCCGG CTCTGTCGCG GTCGCGGCTG AAGGCCCTGA TCCTCGACGG TCGCGTCGCG 
ATTCGCGGCG CCCCGGTCCG CGACCCCGCT TATCACGCCG CCTCGGGGGA GACGATCACA 
ATCGACGTGC CGCCGCCGGT GGCGCCGGAG CCGGCCGGCG AGGCGATCGC GCTCGAGATC 
GTCCACGAGG ACGACGACAT CATCGTCATC GATAAGCCGC GCGGCCTCGT GGTGCATCCC 
GCCGCCGGCC ACGAGACCGG CACCCTGGTC AACGCCTTGA TCGCGCATTG CGGCGAATCG 
CTGTCCGGGA TCGGCGGGGT GCGGCGGCCG GGGATCGTCC ACCGGCTCGA CAAGGACACC 
ACCGGGCTGA TGGTCGCGGC AAAGAATGAT CGAGCCCACC AATCCTTGAG CGCGCAATTC 
GCCGACCATG GCCGCACCGG AGAGCTGCGC CGCGGCTATT ACGCCTTTGT CTGGGGGGCG 
CCGAACCGCA TCCGCGGCAC CATCGACGCG CCGATCGACC GGCATCCCCA TGCCCGCGAA 
AAGATGGCGG TGCGTGACGG CGGACGCGAG GCGATCACCC ATTGGGAGGT GCTGGAGACC 
TTCACGGGCC GCAGCGGCGG CGAGATCGTG TCGCTGATCG CCTGCCAGCT CGAGACCGGC 
CGCACCCACC AGATCCGGGT GCATCTCGCC CATATCGGCC ACCCGCTGCT CGGCGACGAC 
GTCTATGGCC CGCATTTCAA AACCAAGGCC AGCCAGCTCC GCCCGGACGC CCGCGCCGCG 
CTGACGGATC TGGGCCGGCA GGCGCTGCAT GCCTATCTGC TGGTGCTCGA GCACCCCTCC 
ACCGGGGAAG TCGTCGCGTG GGAATCCGGC CTGCCGGCCG ATCTGAAGCG CCTGAAAGCC 
GCCCTGACGG CGACGGAATG A

Protein sequence

MVAGGGGGDD ARPLRQPQRG LGGDRNASLG AEKLIADGDE NRRERQRRGQ ARDHHHPPHP 
RKQRGLFGGR FGQGGFGHAM LGFGSVFLEG SIVNDSSGHL LEVVVAGDEG SPRLDRVLAT 
RCPALSRSRL KALILDGRVA IRGAPVRDPA YHAASGETIT IDVPPPVAPE PAGEAIALEI 
VHEDDDIIVI DKPRGLVVHP AAGHETGTLV NALIAHCGES LSGIGGVRRP GIVHRLDKDT 
TGLMVAAKND RAHQSLSAQF ADHGRTGELR RGYYAFVWGA PNRIRGTIDA PIDRHPHARE 
KMAVRDGGRE AITHWEVLET FTGRSGGEIV SLIACQLETG RTHQIRVHLA HIGHPLLGDD 
VYGPHFKTKA SQLRPDARAA LTDLGRQALH AYLLVLEHPS TGEVVAWESG LPADLKRLKA 
ALTATE