Gene RPC_3824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3824
Symbol
ID	3969283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	4254452
End bp	4255471
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	66%
IMG OID	637926934
Product	aldo/keto reductase
Protein accession	YP_533677
Protein GI	90425307
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTATC GCCAACTCGG CCGGAGCGGC CTAAAAATTT CCCCGTTGTG TCTCGGCACC 
ATGATGTTCG GTGGCGCCAC CGACGAGGCG ACCGCGGTGC GGATCATCGA CAAGGCGCGC 
GGCGCCGGTA TCAATTTCAT CGACACCGCC GACGCCTATT CCAGCGGCGC CGCGGAGGCC 
ATCGTCGGCC GCGCTATCGC CAAGCATCGG CAGCATTGGG TGCTGGCGTC CAAACTCGCC 
AACCCGATGG GCGAAGGCCC CAACCGCGCC GGGCTGTCGC GCCGCTGGGT GATGCAGGCC 
GCCGAAGACA GCCTGAAGCG GCTCGGCACC GACCATCTCG ACATCTACTA CCTGCACAAG 
GAAGATCACG CCACGCCGCT GCACGAGACG GTGCGGGCGA TCGGCGATCT GATCCGCGAC 
GGCAAGATCC GTTACTTCGG CGTATCGAAT TATCGCGCCT GGCGGATCGC GGAAATCTGC 
AACATCTGCG ACCGGCTCGG CATCGACCGC CCGGTGGTCA GCCAGCCCTA TTACAACGCG 
ATGAACCGGA TGCCCGAGGT CGAGCAGATG CCGGCCTGCG ACTTCTACGG TCTCGGTGTG 
GTGCCCTACA GCCCGCTGGC CCGCGGCGTG CTCACCGGCA AGTATCTGCC CGATGCCACG 
CCGGACAAGG ACAGCCGCGC CGGCCGCAAC GACATCCGCA TGATGCAGAC CGAATGGCGC 
CGGGAATCCC TCGAACTGGC GCAGACAATC CGCCGCCACG CCGAAGCCCG CGGCACCACC 
GCCGGCCAGT TCGCGGTGGC CTGGGTGCTG AACAGCGGCT TCGTCAGTTC GGTGATCGCA 
GGACCCCGGA CCGAGCCGCA ATGGGACGAT TACCTCAAGG CGTTGGACTA TCGCTTCACC 
GCCGAGGACG AAGCCCTGAT CGACAGCCTG GTGGTCAGCG GCCATCCTTC GACGCCGGGC 
TACAACGATC CGGCCTACCC GATCGAAGGC CGACGCGCCC GCACAACTGG TAGTATTTAA

Protein sequence

MDYRQLGRSG LKISPLCLGT MMFGGATDEA TAVRIIDKAR GAGINFIDTA DAYSSGAAEA 
IVGRAIAKHR QHWVLASKLA NPMGEGPNRA GLSRRWVMQA AEDSLKRLGT DHLDIYYLHK 
EDHATPLHET VRAIGDLIRD GKIRYFGVSN YRAWRIAEIC NICDRLGIDR PVVSQPYYNA 
MNRMPEVEQM PACDFYGLGV VPYSPLARGV LTGKYLPDAT PDKDSRAGRN DIRMMQTEWR 
RESLELAQTI RRHAEARGTT AGQFAVAWVL NSGFVSSVIA GPRTEPQWDD YLKALDYRFT 
AEDEALIDSL VVSGHPSTPG YNDPAYPIEG RRARTTGSI