Gene RPD_1899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1899
Symbol
ID	4022381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2132717
End bp	2134159
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	67%
IMG OID	637962092
Product	phage SPO1 DNA polymerase-related protein
Protein accession	YP_569035
Protein GI	91976376
COG category	[L] Replication, recombination and repair
COG ID	[COG1573] Uracil-DNA glycosylase
TIGRFAM ID	[TIGR00758] uracil-DNA glycosylase, family 4

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.530135
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTCCA TCCGGCTCGA CAGCGACACC GATTTCCATG GCTGGCGCAA GGCGGCGCGG 
GAGCTTGTGC TGGCGGAGGT CGCGCCGGCT GATATCAGTT GGACGGTGGC AGGCGACGAG 
CCCGAATTGT TCGATGCGCT AGCGCCGCCT GCGCCCTCCC CGAGTGCGCC GTCGTCCGGC 
ACCTTCAACG TTCCCGCTCG CTTCGTCGAG CTTGCGGCGA CCGCGATCCT GCATCGCGAT 
CCGCAGCGCT TCGCCTGGCT GTATCAAGCG CTGTGGCGGC TGCGCGCCAA CCCGGAGCTG 
TTGCAGATCG CGACCGATCC GGACGTTGCG CGGCTGCAGG CGATGGTGAA GGCGGTGCGC 
CGCGATGAGC ACAAAATGCA CGCCTTCGTC CGCTTTCGCG AGATCGGCCG CGAGCCAAAG 
TCGCGCTACG TCGCCTGGTT CGAGCCCGAG CACCATATCG TCGAGGCTGC GGCACCGTTC 
TTCGCCCGGC GCTTCGCCGA CATGGCGTGG TCGATCCTGA CGCCGGACGT CTGCGCGCAT 
TGGGACGGAC ACGCCATTGC GATCACGCCG GGCGTCGCCA AGGCGATGGC CCCATCCGAG 
GATCGATTGG AAGAAACCTG GCTGACCTAC TACGCCAGCA TCTTCAATCC AGCGCGGCTG 
AAGACCAAGG CGATGCAGGC GGAAATGCCG AAGAAATACT GGCGCAATCT ACCGGAAGCA 
GCATTGATCA AGCCGCTGAT CGAGCATGCC GAGCGCGCCG CGCACGCAAT GATCGCCGCG 
GAGGCGACCG CGCCGAAGAA ACCACAACGG CAGGAACAGC CGATGAGCCG AGCCGGACAC 
GAAGGCGATA GGCTCGAAAC CTTGCGCGAA CAGGCGCGCG ACTGCCGCGC CTGCGATCTG 
TGGAAGGACG CGACGCAGAC CGTGTTCGGC GAAGGTCCCC CGCATGCAAG CGTGATGCTG 
GTCGGCGAGC AGCCCGGCGA CAAGGAAGAC CTCGCCGGCC ACCCGTTCGT CGGCCCGGCC 
GGGCAGATGC TCGACCGCGC GCTGGCGGAA GCCGGGATCG ATCGCGCCGA GACCTACGTC 
ACCAACGCGG TGAAGCATTT CAAATTCGTG CCGCGCGGCA AGATCCGCCT GCACCAGAAG 
CCGGCGATGC CGGAAATCAA GGCGTGCCGG CCTTGGTACG AGCGCGAGCT CGCCGCGGTG 
CGCCCGCAGC TCGTGGTGGC GATGGGCGCG ACCGCGGCGC AGAGCGTGCT CGGCAGGATC 
ACACCGATCA ACAAGAACCG TGGCCATCTG ATCGATCGCG ACGGCGGCCC GCAGGTGCTG 
GTCACGGTGC ACCCATCCTA TCTGCTCCGG CTGCCCGACG ACGACGCAAA GGCCCGCGAA 
TACGCACGGT TCGTCGACGA CCTGAAGATC GCCGCCGCGC ATCTGAAGGC TGGGGCGGCC 
TAG

Protein sequence

MHSIRLDSDT DFHGWRKAAR ELVLAEVAPA DISWTVAGDE PELFDALAPP APSPSAPSSG 
TFNVPARFVE LAATAILHRD PQRFAWLYQA LWRLRANPEL LQIATDPDVA RLQAMVKAVR 
RDEHKMHAFV RFREIGREPK SRYVAWFEPE HHIVEAAAPF FARRFADMAW SILTPDVCAH 
WDGHAIAITP GVAKAMAPSE DRLEETWLTY YASIFNPARL KTKAMQAEMP KKYWRNLPEA 
ALIKPLIEHA ERAAHAMIAA EATAPKKPQR QEQPMSRAGH EGDRLETLRE QARDCRACDL 
WKDATQTVFG EGPPHASVML VGEQPGDKED LAGHPFVGPA GQMLDRALAE AGIDRAETYV 
TNAVKHFKFV PRGKIRLHQK PAMPEIKACR PWYERELAAV RPQLVVAMGA TAAQSVLGRI 
TPINKNRGHL IDRDGGPQVL VTVHPSYLLR LPDDDAKARE YARFVDDLKI AAAHLKAGAA