Gene RPC_0437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0437
Symbol
ID	3970199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	471210
End bp	472259
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	69%
IMG OID	637923553
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_530331
Protein GI	90421961
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0702] Predicted nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGAGC GCCACCAAGG CGCTGCCGCG CCGCGGCCTC GATTTTTCGC GATAGGATTC 
CAGCCCATGG CCTCGAATTT GGACACCCTC GTCACGGTTT TCGGCGGTTC GGGATTCATC 
GGCCGGCATG TCGTCGGCGC GCTGGCCAAA CGCGATTTCC GCATCCGGGT CGCGGTGCGC 
CGGCCGGATC TCACCGGGCA TCTGCAGCCG CTCGGCAAGG TCGGCCAGAT CCACGCCGTG 
CAGGCCAACC TGCGCTATCC CGATTCGGTG CAGGCCGCGG TGCGCGACGC CGGCATCGTG 
GTCAATCTGG TCGGCATCCT GGCCGAGGGC GGGGCGCAGA AATTCCAGGC GGTGCAGGCG 
CAGGGCGCCG GCGCCATTGC GCAGGCCGCA GCCGCGGTCG GCGCCCGCAT GGTGCATGTC 
TCGGCGATCG GCGCCGACGC GCAGTCAGCG TCGCTCTATG CCCGCTCCAA GGCCGCCGGA 
GAGCAGGCGG TGCTCGCCGC GGTGCCGCAG GCTGTGATTT TCCGGCCCTC GGTGGTGTTC 
GGCCCCGAGG ACCAGTTCAC CAACCGATTC GCCGGGCTGG CGCGGATGTC GGCAGTGGTG 
CCGCTGATCG GCGGCGGCGC CACCAAATTG CAGCCGGTCT ATGTCGGCGA CGTCGCCACC 
GCGGTGGCGC AGGCGGTCGA CGGCAAGGCC AAGCCGGGCG CCACCTACGA GCTCGGCGGC 
CCGGAAGTGC TGACCATGCG GCAGGTGATC GAGATCATCC TCGACGTCAT CCAGCGCCGC 
CGCATCCTGC TGTCATTGCC GTTCGGGCTG GCGCGGCTGC AGGCGCAGCT GCTGCAATTC 
GCCCCCGGTC CGCTGAAGCT GACCCCCGAC CAAGTGGCCT TGCTGCAGGT CGACAATGTA 
GTGTCGGAGG CCGCCCAGGC AGCCGGGCTG ACGCTGCAGG GGCTCGGCAT CCCGCCGGAT 
TCGCTGCAGG CGATCGCGCC GTCCTATCTG TGGCGATTCC GTGCCACCGG CCAGTTCCAG 
CGCAAGATCG TCGAGCCGAA GAACTCCTGA

Protein sequence

MQERHQGAAA PRPRFFAIGF QPMASNLDTL VTVFGGSGFI GRHVVGALAK RDFRIRVAVR 
RPDLTGHLQP LGKVGQIHAV QANLRYPDSV QAAVRDAGIV VNLVGILAEG GAQKFQAVQA 
QGAGAIAQAA AAVGARMVHV SAIGADAQSA SLYARSKAAG EQAVLAAVPQ AVIFRPSVVF 
GPEDQFTNRF AGLARMSAVV PLIGGGATKL QPVYVGDVAT AVAQAVDGKA KPGATYELGG 
PEVLTMRQVI EIILDVIQRR RILLSLPFGL ARLQAQLLQF APGPLKLTPD QVALLQVDNV 
VSEAAQAAGL TLQGLGIPPD SLQAIAPSYL WRFRATGQFQ RKIVEPKNS