Gene Rpal_4978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4978
Symbol
ID	6412670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5357814
End bp	5358863
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	71%
IMG OID	642714861
Product	A/G-specific adenine glycosylase
Protein accession	YP_001993942
Protein GI	192293337
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.183286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCGCGCGC GGCCCGCCGC ATTGCTGGCC TGGTACGACC GGCATCGCCG CACCCTGCCG 
TGGCGGGCGC CGCCCGGCGC GACCGCCGAT CCCTATGCGG TGTGGCTGTC GGAGATCATG 
CTGCAGCAGA CCACCGTTCG TGCGGTCGGG CCGTATTTCG ACAAGTTCAT GGCGCGGTGG 
CCGACGGTGA CGGCGCTGGG CGAGGCCTCG CTCGACGACG TGCTGAAGAT GTGGGCCGGG 
CTCGGCTACT ATTCACGCGC CCGCAACCTG CACGCCTGCG CGGTGGCGGT GACGCGCCAG 
CACGGCGGCC GCTTTCCCGA CACCGAGGAG GGGCTGCGGG CGCTGCCCGG CGTCGGGCCC 
TACACAGCAG CCGCCATCGC CGCGATCGCG TTCAGCCGCC GGACCATGCC GGTCGACGGC 
AATATCGAGC GGGTGGTGTC GCGGCTGTAC GCGGTCGAGG ACGAACTGCC GAAGGCCAAG 
CCGCGCATCA AGGCGCTGGC CGAGACGCTG CTCGGCCCGT CCCGCGCCGG TGACAGCGCC 
CAGGCGCTGA TGGATCTCGG CGCCACCATC TGCACGCCGA AGAAGCCGGC CTGCGCGCTG 
TGCCCGCTGA TGCAGGGCTG CACCGCACGG CTGCGCGGTG ATGCCGAGAG CTTTCCGCGC 
AAGGCGCCGA AGAAGACCGG GGCGCTGCGC CGCGGTGCCG CCTTCGTGGT GATCCGCGGC 
GATCAGGTGC TGGTCCGCAG CCGCCCCGCC AAGGGCCTGC TCGGCGGCAT GACCGAGGTG 
CCGAACTCCG ACTGGTTGCC CGATCAGGAC GAAGCCGCCG CCAAGGCGCA GGCCCCGGCG 
CTGAAAGGCG TCGGTCGCTG GCATCGCAAA GCCGGCGTCG TCAGCCATGT GTTCACGCAC 
TTCCCGCTGG AGCTGGCCGT GTATGTGGCG CATGCCTCGG CCGGCACCCG AGCCCCCACC 
GGCATGCGCT GGACGCAGAT CTCGACGCTG TCGGACGAAG CTTTGCCCAA TCTGATGCGC 
AAGGTGATCG CCCACGGCCT CGGTGATTGA

Protein sequence

MRARPAALLA WYDRHRRTLP WRAPPGATAD PYAVWLSEIM LQQTTVRAVG PYFDKFMARW 
PTVTALGEAS LDDVLKMWAG LGYYSRARNL HACAVAVTRQ HGGRFPDTEE GLRALPGVGP 
YTAAAIAAIA FSRRTMPVDG NIERVVSRLY AVEDELPKAK PRIKALAETL LGPSRAGDSA 
QALMDLGATI CTPKKPACAL CPLMQGCTAR LRGDAESFPR KAPKKTGALR RGAAFVVIRG 
DQVLVRSRPA KGLLGGMTEV PNSDWLPDQD EAAAKAQAPA LKGVGRWHRK AGVVSHVFTH 
FPLELAVYVA HASAGTRAPT GMRWTQISTL SDEALPNLMR KVIAHGLGD