Gene RPD_0442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0442
Symbol
ID	4020908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	509393
End bp	510451
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	64%
IMG OID	637960627
Product	exodeoxyribonuclease III
Protein accession	YP_567581
Protein GI	91974922
COG category	[L] Replication, recombination and repair
COG ID	[COG0708] Exonuclease III
TIGRFAM ID	[TIGR00195] exodeoxyribonuclease III [TIGR00633] exodeoxyribonuclease III (xth)

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.576927
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGATG CGCGGGTCAA GCCCGCGCAT GACGCCGTGC TGGATCGCAC CGACGGTCGC 
GTAGGCCGTC TCTATCAAGA CCGTCATGCC GGGCTTGACC CGGCAATCCA TCCCCTTCGT 
AAGACGCCAC AGCAAGCACC TGGCTGGTTG TACACATCAG CGGCTTGCGT TCGATCGCGT 
GCCGCGCAAC AAACAGCGCG TTCTTCGCAA AGACGGCGTC CCGCCCGCAA CTCGCCCCGG 
CTTCCCATGC GCTTCACCCT CACGACATGG AACATCAACT CGGTCCGGCT GCGCATCGAT 
CTGGTCGCGG CGTTCCTGAA AGAGCAGCAG CCCGACGTGC TGTGCCTGCA GGAGACCAAG 
TGTCCCGACG ACGCGTTTCC GCTGAAGCGC TTCAAGCAGC TCGGCTACGA GCACATCGCG 
CTGAACGGAC AGAAGGGCTA TCACGGCGTC GCGGTGATCT CGAAGATTCC GTTCGTCGCG 
CGCGACATCC GCATTTTCTG CGACAACCTC GACTCGCGCC ACATCTCGGT GTCGCTCGGC 
ACCGGCGACA ACGATCCGCC GCTGGTGCTG CATAATTTCT ACGTGCCTGC CGGCGGCGAC 
GTTGCCGATC CCGAACTCAA TCCGAAGTTC AAGCACAAGC TGTCGTTTCT CGACGAGATG 
AAGGCCTGCG AGCCGCTGCA TCCCTCCGGC GACGCGCGGC ATATTCTGGT CGGCGACCTC 
AACGTCGCGC CGCACGAGCA CGACGTCTGG TCGCACAAGC AGTTACTTAA AGTCGTGTCG 
CACACGCCGG TGGAATGCGA GAAGCTGCTC GCCGTGCTGC GCGCCGGCAA TTGGGTCGAC 
GTCGCGCGCG ACCGGATTCC GCTGTCGGAG AAGATCTACA CCTGGTGGAG CTATCGCGCC 
GCCGACTGGA CCGTCGGCGA TCGCGGCCGA CGGCTCGATC ACATCTGGGT CTCCGAAGCG 
CTGCGCACCC GCGTCACAGA CTTCAAGATC CTGCGCGACG CGCGAAGCTG GGAACGCCCG 
AGCGACCACG TCCCGGTGAC GGTGACGATG GAGCTGTAA

Protein sequence

MMDARVKPAH DAVLDRTDGR VGRLYQDRHA GLDPAIHPLR KTPQQAPGWL YTSAACVRSR 
AAQQTARSSQ RRRPARNSPR LPMRFTLTTW NINSVRLRID LVAAFLKEQQ PDVLCLQETK 
CPDDAFPLKR FKQLGYEHIA LNGQKGYHGV AVISKIPFVA RDIRIFCDNL DSRHISVSLG 
TGDNDPPLVL HNFYVPAGGD VADPELNPKF KHKLSFLDEM KACEPLHPSG DARHILVGDL 
NVAPHEHDVW SHKQLLKVVS HTPVECEKLL AVLRAGNWVD VARDRIPLSE KIYTWWSYRA 
ADWTVGDRGR RLDHIWVSEA LRTRVTDFKI LRDARSWERP SDHVPVTVTM EL