Gene RPB_3589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3589
Symbol
ID	3911391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4113768
End bp	4114682
Gene Length	915 bp
Protein Length	304 aa
Translation table	11
GC content	67%
IMG OID	637885491
Product	Short-chain dehydrogenase/reductase SDR
Protein accession	YP_487195
Protein GI	86750699
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.336775
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.435247
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGG CACTCGACGG CAAAGTCATC ATCGTCACCG GCGCGGGGCG CGGCATTGGG 
CGCGAGATCG CGCTGCTCGC GGCGCGCGAG GGCGCCAAGG TCGTCGTCAA CGATCCGGGC 
GTCGCCGCCG ACGGCTCGGG CACTGACGCC TCGCCGGCCG AGCAGGTGGT CGAGGAGATC 
AAGAAGGAAG GCGGCATCGC GGTCGCCAAT TTCGAAAGCG TGGCGGAAGC CGTGCCGGCC 
AGCAAGATCG TCAAGCAGGC GGTCGACACC TGGGGCAAGC TCGACGGCGT CGTCAACAAT 
GCCGGCATCC TGCGCGACGC GATCTTCCAT CGCATGAGCA TCGACGCCTT CGAGCAGGTC 
ATCAAGGTGC ATCTGATGGG CTCGTTCTAC GTGTCGCACG CTGCCGCGCG CTTGTTCCGC 
GAGCAGGAGA GCGGGTCGTT CGTGCACTTC ACCTCGACCT CGGGGCTGAT CGGCAATTTC 
GGCCAGGCCA ACTACGCCGC CGCCAAGCTC GGCATCGTCG GCCTGTCGAA GTCGATCGCG 
CTCGACATGC AGCGCTTCAA CGTCCGCTCC AATTGCGTGT CGCCGTTCGC CTGGTCGCGG 
CTGATCGGCA CCATCCCGAC CGAGACCGAA GCCGAAAAGG CGCGCGTCGC GCGGATGCAG 
CAGATGGGCC CGGAGAAGAT CGCGCCGCTG TCGGTGTTCC TGCTCGGCGA TGCGGCGAAG 
GACGTCACCG GCCAGATCTT CGCGGTGCGG ATGAACGAGA TCTTCCTGAT GGGCCAGTCG 
CGCCCGATCC GCTCGGTGCA CCGCGACGGC GGCTGGACCT GCGAGACGCT GGCCGAGCAC 
GGCATGCCGG CGCTGAAAGG TTCGTTCTAC AAGCTCGACC GCTCCGCCGA CATCTTCAAC 
TGGGACGCGA TCTGA

Protein sequence

MAKALDGKVI IVTGAGRGIG REIALLAARE GAKVVVNDPG VAADGSGTDA SPAEQVVEEI 
KKEGGIAVAN FESVAEAVPA SKIVKQAVDT WGKLDGVVNN AGILRDAIFH RMSIDAFEQV 
IKVHLMGSFY VSHAAARLFR EQESGSFVHF TSTSGLIGNF GQANYAAAKL GIVGLSKSIA 
LDMQRFNVRS NCVSPFAWSR LIGTIPTETE AEKARVARMQ QMGPEKIAPL SVFLLGDAAK 
DVTGQIFAVR MNEIFLMGQS RPIRSVHRDG GWTCETLAEH GMPALKGSFY KLDRSADIFN 
WDAI