Gene RPB_3599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3599
Symbol
ID	3911401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4129228
End bp	4130100
Gene Length	873 bp
Protein Length	290 aa
Translation table	11
GC content	66%
IMG OID	637885501
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_487205
Protein GI	86750709
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.55778
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.875827
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTCCG ATCAGCTTCT CGCAGGCCGT CGTATCCTCG TCACCGGTGG CGGCACCGGG 
CTCGGCAAAT CGATGGCCGC GCGCTTCCTG CAGCTCGGCG CCGAAGTCCA TATCTGCGGC 
CGCCGCAAGG GCGTCTGCGA CGAGACCGCG ACCGAACTGA TGGATCAGTA CGGCGGCAAG 
GTGATGACCT ACGGCGTCGA CATCCGCGAC TCGGCCGCGG TCGACCACAT GGTCGAGACC 
ATCTTCGCCG ACGGCCCGCT CACCGATCTG ATCAACAACG CCGCCGGAAA TTTCATCTCG 
CGGACGGAAG AGCTGTCGCC GCGCGGCTTT GACGCCGTCG CCAACATCGT GATGCACGGC 
ACCTTCTACG TGACGCATGC GGTCGGCCGG CGCTGGATCG CCGGCGGCCA CCGCGGCAAT 
GTGGTGTCGA TCACCACCAC CTGGGTCCGC AACGGCAGCC CCTATGTGGT GCCCTCGGCG 
ATGAGCAAAT CGGCGATCCA CGCCATGACG ATGTCGCTCG CCACCGAATG GGGCCGCTAC 
GGCATCCGCC TCAACACCAT TGCGCCCGGC GAAATTCCCA CCGAAGGCAT GAGCAAGCGG 
ATCAAGCCCG GCGACGAGGC CGGCGCCCGC ACCGTGAAGG TGAATCCGAT GGGCCGCGTC 
GGCACCATGG AGGAACTGCA GAACGTCGCG GTGTTCCTGA TCTCCGGCGG CTGCGACTGG 
ATCAACGGCG AAACCATCGC GATGGACGGC GCCCAGGGCC TGGCGATGGG CGGCAATTTC 
TATCAGCTGC GCGACTGGAG CAACGCCGAC TGGGACCAGG CCAAGGCCTC GATCAAGGCG 
CAGAACGAAA AAGACCGCGC ACAGCGGGGG TGA

Protein sequence

MFSDQLLAGR RILVTGGGTG LGKSMAARFL QLGAEVHICG RRKGVCDETA TELMDQYGGK 
VMTYGVDIRD SAAVDHMVET IFADGPLTDL INNAAGNFIS RTEELSPRGF DAVANIVMHG 
TFYVTHAVGR RWIAGGHRGN VVSITTTWVR NGSPYVVPSA MSKSAIHAMT MSLATEWGRY 
GIRLNTIAPG EIPTEGMSKR IKPGDEAGAR TVKVNPMGRV GTMEELQNVA VFLISGGCDW 
INGETIAMDG AQGLAMGGNF YQLRDWSNAD WDQAKASIKA QNEKDRAQRG