Gene RPC_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0020
Symbol
ID	3971445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	23282
End bp	24178
Gene Length	897 bp
Protein Length	298 aa
Translation table	11
GC content	64%
IMG OID	637923134
Product	short chain dehydrogenase
Protein accession	YP_529918
Protein GI	90421548
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCAC TGAAGGGCAA GACGCTGTTC ATTTCCGGCG GCAGCCGCGG CATTGGGCTG 
GCGATCGCGC TACGTGCGGC GCGCGACGGC GCCAATGTGG CGATCGCCGC CAAGACCGCC 
GAGCCACATC CCAAACTCCA GGGCACGATC TATACCGCGG CGGACGAGGT GCGCGCCGCC 
GGCGGCAACG CGCTGCCGAT CCTGTGCGAC ATCCGCGACG AGGCCCAGGT GATCGCCGCG 
ATCGACAAGA CGGTCGGCGA GTTCGGCGGC CTCGATATCT GCGTCAACAA TGCCTCTGCG 
ATCAGTCTCA CCAACTCACA AAATACCGAC ATGAAGCGGT TCGACCTGAT GATGGGGATC 
AACACCCGCG GCACCTTCAT GGTGTCGAAA TATTGCATTC CGCATCTGAA GAAGGCCGAG 
AACCCGCACA TCCTGATGCT GTCGCCGCCG CTCGACATGA AGCCAAAATG GTTCGAGCAC 
TCCACCGCCT ACACCTTGGC CAAGTTCGGC ATGAGCATGT GCGTGCTGGG ATTGTCCGGC 
GAACAAAAGC GCGCCGGCAT CGCCGTCAAC GCGCTGTGGC CGCGCACCAC CATCGCCACC 
GCGGCGGTCG GCAATCTCTT GGGCGGCGAC GCCATGATGC GCGCCAGCCG GACGCCGGAG 
ATCATGGGCG ACGCGGCCTA TGAGATCTTT CTCAAGCCGT CGCGCGAGTT CACCGGGCAG 
TTCTGCATCG ACGACAAAGT GCTGTATGAA GCGGGCGTCA CCGATTTCGA GCGCTACCGC 
GTCGATCCCT CGGTGCCCCT GATGTCGGAT TTCTTCGTGC CCGACGACGA TGTGCCGCCG 
CCCGGCGTCA GCGTGAGGAC GCTGCCCTCG GTCGATGCGG CGAAGGCGAA GGGGTAG

Protein sequence

MASLKGKTLF ISGGSRGIGL AIALRAARDG ANVAIAAKTA EPHPKLQGTI YTAADEVRAA 
GGNALPILCD IRDEAQVIAA IDKTVGEFGG LDICVNNASA ISLTNSQNTD MKRFDLMMGI 
NTRGTFMVSK YCIPHLKKAE NPHILMLSPP LDMKPKWFEH STAYTLAKFG MSMCVLGLSG 
EQKRAGIAVN ALWPRTTIAT AAVGNLLGGD AMMRASRTPE IMGDAAYEIF LKPSREFTGQ 
FCIDDKVLYE AGVTDFERYR VDPSVPLMSD FFVPDDDVPP PGVSVRTLPS VDAAKAKG