Gene RPD_3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3041
Symbol
ID	4023544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3388051
End bp	3389340
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	67%
IMG OID	637963240
Product	DNA polymerase IV
Protein accession	YP_570168
Protein GI	91977509
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.678009
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.273789
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGAAG CGGGGCCGCC CGGGCCGCTG TGCTTCTGTC GCGACTGCCT CACCGATCTC 
GGGGCGGACG CGCGGCGCTG CAGCGCGTGC GGCTCTCCGC GACTGCTCCG CCATCCCGCG 
CTGTCGACGC TGACGCTCGC GCATATCGAC TGCGATGCGT TCTACGCGAC CGTCGAGAAG 
CGCGATAATC CCGACCTCGC CGACCGGCCG GTGATCATCG GCGGCGGCAG GCGCGGCGTC 
GTCTCGGCCG CCTGCTACAT CGCGCGCACC TTCGGCGTTC GCTCGGCGAT GCCGATGTTC 
AAGGCGCTGG CGCTGTGCCC CTCGGCTGCT GTCGTGCGCC CCGACATGGC GAAATACGTC 
CGCGTCGGCC GCGAGGTTCG CCAGGCGATG CTGCAACTCA CGCCGCTGGT CGAGCCGCTG 
TCGATCGATG AGGCGTTTCT CGATCTGTCC GGCACCGAGC GGATGCACGG CGCGATCGCC 
GCCAAGGTAT TGGCGCGGTT CGCCCGCGAC ACCGAACGCG ACATCGGCAT CACCGTGTCG 
GTGGGCCTGT CGTGCAACAA ATTCCTCGCC AAGATCGCCT CCGACCTCGA CAAGCCGCGC 
GGTTTCGCCA CGCTCGATCA GGACGATGCG AAGGCGATGC TGGGGCCCCG CCCCGTAAGC 
TTCATCTTCG GCGTCGGCCC CGCGACGGCG GCTCGGGTCG CTCAGTACGG CTTCCGCACC 
ATCGCCGATC TGCAGAAGGC CGACGAGATC GACCTGATGC GGCAGTTCGG CGACGAAGGA 
CGGCGACTGT GGCGGCTCGC CCGCGGCATC GACAATCGCA AGGTCGTGCC GGATCGCGGC 
GCCAAGTCGA TCTCCAATGA AACCACCTTC GAAACCGACA TCCGCGATCT GGAGACGCTG 
GAACGGATCC TGTGGCGACT GTCGGACAAG GTTTCGTCGC GGCTGAAAAG CGCCGGCCTC 
GCCGGTTCGA CCATCACGTT GAAACTGAAG TCGAGCGACT TTCGCCAGCG CACCCGCTCG 
CAGACGATTC ACGCGCCGAC TCAGCTCGCC AATCGCATTT TCGCGGTGTC GCGCGAGATG 
CTGGTCAAGG AAATCGACGG CACCGCCTTC CGCCTGATCG GCACCGGCGT CAGCGCGCTG 
ACCGAACAGG CACAGGCCGA CGAGACCGAC ATGCTGGATG CCCGCGCCGC GACAGCCGAG 
CGCGCGATCG ACGATCTGCG CAAGAAGTTC GGTGACGCCG CGGTGATCCG CGGCCTCGCC 
TATAACGGAC CGGACAAACC GCGGAGTTAG

Protein sequence

MSEAGPPGPL CFCRDCLTDL GADARRCSAC GSPRLLRHPA LSTLTLAHID CDAFYATVEK 
RDNPDLADRP VIIGGGRRGV VSAACYIART FGVRSAMPMF KALALCPSAA VVRPDMAKYV 
RVGREVRQAM LQLTPLVEPL SIDEAFLDLS GTERMHGAIA AKVLARFARD TERDIGITVS 
VGLSCNKFLA KIASDLDKPR GFATLDQDDA KAMLGPRPVS FIFGVGPATA ARVAQYGFRT 
IADLQKADEI DLMRQFGDEG RRLWRLARGI DNRKVVPDRG AKSISNETTF ETDIRDLETL 
ERILWRLSDK VSSRLKSAGL AGSTITLKLK SSDFRQRTRS QTIHAPTQLA NRIFAVSREM 
LVKEIDGTAF RLIGTGVSAL TEQAQADETD MLDARAATAE RAIDDLRKKF GDAAVIRGLA 
YNGPDKPRS