Gene Rpal_0344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0344
Symbol
ID	6407990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	362809
End bp	363741
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	69%
IMG OID	642710254
Product	transcriptional regulator, AraC family
Protein accession	YP_001989380
Protein GI	192288775
COG category	[F] Nucleotide transport and metabolism [L] Replication, recombination and repair
COG ID	[COG0350] Methylated DNA-protein cysteine methyltransferase [COG2169] Adenosine deaminase
TIGRFAM ID	[TIGR00589] O-6-methylguanine DNA methyltransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.251255
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCGGCGC GCGCCGCGGC GGATAACATC AGCGGTATGA TGAACCTTGC CATTGCCGAC 
CACCAGCTCA TCAAACCCGG CGCCCGCGAT TCCGCGTTGG CCGACTACGA CTGCGTGCGG 
CGCGCCATCG CCTTCATCTC GCAGAAATGG AAGGCGCAGC CGACCATCGA GGCGATCGCC 
GACGCCGCCG GCCTGACGCC CGACGAGCTG CACCATCTGT TCCGGCGCTG GGCGGGGCTG 
ACGCCGAAGG CGTTCATGCA GGCGCTGACG CTCGACCACG CCAAATCGCT GCTGCGGGAT 
TCCGCCAGCG TGCTCGATGC CGCGCTGGCC TCCGGGCTGT CCGGCCCCGG CCGACTGCAC 
GATCTGTTCG TCACCCACGA GGCGATGTCG CCGGGCGAAT GGAAGAGCGG CGGCGCCGGG 
CTCAGCCTGC GCTACGGCTT TCATCCGTCG CCGTTCGGCA CCGCGGTGAT CATCGCCTCC 
GATCGCGGCC TTGCCGGTCT CGCCTTCGCC GACCCGGACG AGGAGCAGGC GGCGCTGGTC 
GATCTGCAAC AGCGCTGGCC GCGCGCGGTG TGCACGCAGG ATCAGGACGC GACTGCTCCG 
TTGGCGCGGC GGATCTTCGA TCCGGCACAA TGGCGTGCCG AGCAGCCGCT GCGGGTGGTG 
CTGATCGGCA CCGATTTCGA AGTGCGGGTG TGGGAGACGC TGCTGAAGAT CCCGCTCGGC 
AAGGCGGTTT GCTACTCGGA CATCGCCGCT AAGATCAGCC TACCGAAAGC CTCGCGCGCG 
GTCGGCGCCG CGGTCGGCAA GAACCCGATC TCGTTCGTGG TGCCGTGCCA TCGCGCGCTT 
GGCAAAGGCG GCGCACTCAC CGGCTATCAC TGGGGCCTGA CCCGCAAGCA GGCGATGATC 
GGCTGGGAAG CCGGGCAACT CAGGGCAGAG TGA

Protein sequence

MAARAAADNI SGMMNLAIAD HQLIKPGARD SALADYDCVR RAIAFISQKW KAQPTIEAIA 
DAAGLTPDEL HHLFRRWAGL TPKAFMQALT LDHAKSLLRD SASVLDAALA SGLSGPGRLH 
DLFVTHEAMS PGEWKSGGAG LSLRYGFHPS PFGTAVIIAS DRGLAGLAFA DPDEEQAALV 
DLQQRWPRAV CTQDQDATAP LARRIFDPAQ WRAEQPLRVV LIGTDFEVRV WETLLKIPLG 
KAVCYSDIAA KISLPKASRA VGAAVGKNPI SFVVPCHRAL GKGGALTGYH WGLTRKQAMI 
GWEAGQLRAE