Gene RPC_0337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0337
Symbol
ID	3971018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	357889
End bp	358821
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	70%
IMG OID	637923451
Product	AraC family transcriptional regulator
Protein accession	YP_530231
Protein GI	90421861
COG category	[K] Transcription [L] Replication, recombination and repair
COG ID	[COG0350] Methylated DNA-protein cysteine methyltransferase [COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID	[TIGR00589] O-6-methylguanine DNA methyltransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGCGG GCATCGTCCC CGCTTACATC ACAACCATGA TGAACCTCGC CGTGACCGAT 
CATCGCCTCG CCAAGCCCGG CCCGCAGGAC AGCGCCTTGC GGGATTATGA TTCGGTGCGC 
CGCGCCATCG GCTTCATCTC CGAGCGCTGG CGCGCGCAGC CCGCGATCGA ATCCATCGCC 
GACGCCGCCG GCGTCACGCC CGACGAATTG CATCTGTTGT TCCGGCGCTG GGCTGGCCTC 
ACGCCGAAAG CCTTCATGCA GGCGCTGACG CTGGACCACG CCAAGAGCCT GCTACGCGAC 
TCCGCCAGCG TGCTCGATGC GGCGCTGGAT AGCGGCCTGT CCGGGCCGGG GCGGTTGCAC 
GACCTGTTCG TCACCCATGA GGCGATGTCG CCCGGCGAAT GGAAGAGCGG CGGCACCGGT 
ATGACGCTGC GCTACGGCTT CCACCCGTCG CCGTTCGGCA CCGCGGTGGT GATCGAAAGC 
GCGCGCGGCC TCGCCGGGCT GGCCTTCGCC GATCCGGGTG AGGAGCTCAC CGCACTCGCC 
GACATGCAGC GGCGCTGGCC GCGCGCGAGT TATGTGGAAG ACGCCGCCGG CACCGCGGCG 
CTGGCGCAAC GCATCTTCGA CACCAGGCAA TGGCGCGCCG ACCAGCCGCT GCGCGTGGTG 
CTGATCGGCA CCGATTTCGA GGTCCGGGTG TGGGAGACGC TGTTGAAGAT CCCGATGGGC 
CGCGCGGTCA GCTATTCGGA TATCGCGGGC TGCATCAGTC TGCCGAAGGC CTCGCGCGCG 
GTCGGCGCCG CGGTCGGCAA GAACCCGGTG TCGTTCGTGG TGCCGTGCCA CCGCGCGCTC 
GGCAAGAGCG GCGCGCTGAC CGGCTATCAC TGGGGCCTGA CCCGCAAACG CGCGATGCTG 
GGCTGGGAGG CCGGGCAGGT CGGGATGGAG TGA

Protein sequence

MAAGIVPAYI TTMMNLAVTD HRLAKPGPQD SALRDYDSVR RAIGFISERW RAQPAIESIA 
DAAGVTPDEL HLLFRRWAGL TPKAFMQALT LDHAKSLLRD SASVLDAALD SGLSGPGRLH 
DLFVTHEAMS PGEWKSGGTG MTLRYGFHPS PFGTAVVIES ARGLAGLAFA DPGEELTALA 
DMQRRWPRAS YVEDAAGTAA LAQRIFDTRQ WRADQPLRVV LIGTDFEVRV WETLLKIPMG 
RAVSYSDIAG CISLPKASRA VGAAVGKNPV SFVVPCHRAL GKSGALTGYH WGLTRKRAML 
GWEAGQVGME