Gene RPD_3031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3031
Symbol
ID	4023534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3376534
End bp	3377802
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	70%
IMG OID	637963230
Product	DNA processing protein DprA, putative
Protein accession	YP_570158
Protein GI	91977499
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.461494
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.318128
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAGGCC GCCGCAGATC TTGGCGCGTG GTCTCATCAG GACCGAAGTA CCACCGCCGA 
CCCTCCCGCC CCGCCTTCAT CGAACTTGCC CACACCTATA AGTTGCGCAA CACTCGCCTT 
TCGGAGGTGG GCGTGAGTGA CAGCGGCGGA AACCAAGGCA CTACGCGCCT CACCGAGGCG 
CAGCGGATCG ACTGGCTGCG GCTGATCCGC GCCGACAATG TCGGGCCGCG CACCTTTCGC 
TCGCTGGTCA ATCATTTCGG TTCGGCGCGC GCCGCGCTGG AGCGGCTACC CGAACTCGCC 
CGCCGCGGCG GCGCAGCGCG GGCCGGTCGC ATTCCCAGCG AAGACGAGGC GCGCCGGGAG 
ATCGATGGCG GCCACCGGCT CGGCGTCGAA CTGGTCGCGC CGGGCGAACC CGGCTACCCG 
CCTCGCCTCG CGCTGATCGA CGACGCGCCG CCGCTGCTCG GAGTTCATTG CGTGCCCGAT 
GCGCTCGCCG AGATGCAGCG GCCAATGATC GCGATCGTCG GCTCGCGCAA CGCCTCCGGC 
GCCGGATTGA AATTCGCCTC CGAACTCGCG CGCGATCTCG GCGCCGCCGG CTTCGTGGTG 
ATCTCGGGAC TGGCCCGCGG CGTTGATCAG GCTGCGCATC GCGCGAGCCT CGCCAATGGC 
ACGGTCGCCG TGCTGGCCGG CGGTCACGAC AAGATCTATC CGCCCGAACA CGAAGACCTG 
CTGCTCGACA TCGTCGAGGC GCGCGGCGCA GCGATTTCAG AGATGCCGCT CGGCCACGTC 
CCGCGCGGCA AGGATTTTCC CCGCCGCAAC CGGTTGATTT CCGGCGCGGC TGTCGGGGTC 
GCGGTGATCG AGGCGGCCTA TCGCTCCGGC TCGCTGATCA CCGCCCGCCG CGCCGCCGAC 
CAAGGCCGCG AGGTATTTGC CGTGCCGGGC TCGCCACTCG ATCCGCGCGC CGCCGGAACC 
AACGATCTGA TCAAGCAGGG GGCGACGCTG ATCACCTCGG CCGACGACAT TATCCAGGCC 
GTCGCCCCGA TCATGGACCG GCCGGTGGAA TTGCCGGGCC GCGAGCCGGA ACACCCGGCT 
CCGGCGAGCG AGCCGGATGC CAGCCACCGC GGCCGTATCG TCAACCTGCT CGGGCCGAGC 
CCGATCGGCA TCGACGATCT GATCCGGCTG TCCGGCATCC CGCCGGCTGT CGTGCGTACC 
GTGCTGCTCG AACTGGAACT CGCCGGCCGC CTCGACCGCC ACGGCGGCGG ATTGGTGTCG 
CTGCTCTAG

Protein sequence

MIGRRRSWRV VSSGPKYHRR PSRPAFIELA HTYKLRNTRL SEVGVSDSGG NQGTTRLTEA 
QRIDWLRLIR ADNVGPRTFR SLVNHFGSAR AALERLPELA RRGGAARAGR IPSEDEARRE 
IDGGHRLGVE LVAPGEPGYP PRLALIDDAP PLLGVHCVPD ALAEMQRPMI AIVGSRNASG 
AGLKFASELA RDLGAAGFVV ISGLARGVDQ AAHRASLANG TVAVLAGGHD KIYPPEHEDL 
LLDIVEARGA AISEMPLGHV PRGKDFPRRN RLISGAAVGV AVIEAAYRSG SLITARRAAD 
QGREVFAVPG SPLDPRAAGT NDLIKQGATL ITSADDIIQA VAPIMDRPVE LPGREPEHPA 
PASEPDASHR GRIVNLLGPS PIGIDDLIRL SGIPPAVVRT VLLELELAGR LDRHGGGLVS 
LL