Gene RPB_3564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3564
Symbol
ID	3911366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4083820
End bp	4085286
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	74%
IMG OID	637885466
Product	hypothetical protein
Protein accession	YP_487170
Protein GI	86750674
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.677515
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCGCCG CCAAGCGCGA CAATGCACTG GTCGTCGTCG CCTGCGATGC ATGCGCGACG 
CAGGGCGGGT TGATGCCGGG GATGCCGCTC GCCACCGCGC GGGCGATGCA TCCGTCGCTC 
GACGTGATCG ATCACGATCC GCATGCCGAC GCCGCGCTGC TCGCGTCTGT CGCCGACTGG 
TGCGACCGCT TCACGCCGCT GGTGGCGTTC GACGGCGCCG ACGGATTGCT GCTCGACATC 
ACCGGCTGCG CGCATCTGTT CGGCGACGAG GCCGAACTGC TGCGCATGCT CACCACTGCG 
CTGACGCGGC AGGGCTTTGC GGTGAGCGCG GCGATCGCCG GCACCGCGGT GGCGGCGCGG 
GCACTGACCC GCGGCGCGCC GGGCAGGATC GTGGCGCCGG GCGAGGAAGC CGCGGCGGTC 
GCGCCGTTGC CGGTGGCGGC GCTCGGCGTC AGCGAGGCGA TCGTGCGCGG CCTTTGCCGC 
GCCGGCCTCA CCACCATCGG CGATGTGCTG GCGCGGCAGC CGTCCGAACT CGCGGCGCGG 
TTCGGCGAAG CCTTCATCGC GGTGCTGCGT CAGGCGACCG GCGAGGACGA CGCGCCGATT 
TCGCCGCGCA AGCCGGCGCC GGACTATGTC GTGGACAAGC GCTTTGCCGA GCCGGTCGCC 
ACCACCGAGG TGATCCTGCC GACGCTGCTG GCGCTGGCGC GGCTGCTGAT CGCCGCGATG 
GAACGCAGCG GCAAGGGCGC GCGGCAGCTC ACCGCCTCGT TCTTCCGCAG CGATGGGGCG 
GTGCGCAGCC TTGTGGTGGA GGCCGGACAG CCGGTGACGC GGGTCGAGGT GGTGCAGCGG 
CTGTTTGCGG AGCGGCTCGA TGCGCTGGCG GACCCGCTCG ATCCCGGCTT CGGCTACGAC 
CTGATCCGCC TCGCCGCGAG CCGGTGCGTT GCCATCGCCG AGGCGCAGCG CGGCTTCGAC 
ACCACCGCGC ACCAGGCCGA AGACGTCGCT CTGCTGGCCG ACACGCTGTC GGCGCGGCTC 
GGGGCGCGGC GCGTGGTGCG CTATCTGCCG CAGAACACGC ACATCCCCGA GCGTGCGGCG 
CTCGCCGTGC CGGTGCAGCA TTGCCCGCCG GACGCGGACG ATGCGCCGTG GCCGGCGCGC 
GCCGACGAGC CGCCGCTGCG GCCGCTGCGC CTGCTGCAGC CGCCGGAGCC GATCGAGGTG 
CTGGCCGGCG TGCCGGACGG GCCGCCGGCG CAATTCACCT GGCGCCGCGT TCTCCACCGC 
GTCGCCCGCG CCGAAGGCCC GGAGCGGATC GCGATGGAGT GGTGGCGCGC CGCCGAGCCC 
GGCCTGACCC GCGATTACTT CCGCATCGAG GACGAATCCG GCACGCGGTT CTGGCTGTAT 
CGCGACGGCC TGTATGGCCG CGAGGTGATG CCGCAGCCGG ACGGCGGCGG CCAGCCGCGC 
TGGTACATGC ACGGCCTGTT CGCGTGA

Protein sequence

MVAAKRDNAL VVVACDACAT QGGLMPGMPL ATARAMHPSL DVIDHDPHAD AALLASVADW 
CDRFTPLVAF DGADGLLLDI TGCAHLFGDE AELLRMLTTA LTRQGFAVSA AIAGTAVAAR 
ALTRGAPGRI VAPGEEAAAV APLPVAALGV SEAIVRGLCR AGLTTIGDVL ARQPSELAAR 
FGEAFIAVLR QATGEDDAPI SPRKPAPDYV VDKRFAEPVA TTEVILPTLL ALARLLIAAM 
ERSGKGARQL TASFFRSDGA VRSLVVEAGQ PVTRVEVVQR LFAERLDALA DPLDPGFGYD 
LIRLAASRCV AIAEAQRGFD TTAHQAEDVA LLADTLSARL GARRVVRYLP QNTHIPERAA 
LAVPVQHCPP DADDAPWPAR ADEPPLRPLR LLQPPEPIEV LAGVPDGPPA QFTWRRVLHR 
VARAEGPERI AMEWWRAAEP GLTRDYFRIE DESGTRFWLY RDGLYGREVM PQPDGGGQPR 
WYMHGLFA