Gene RPD_1646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1646
Symbol
ID	4022126
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1853844
End bp	1854824
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	72%
IMG OID	637961841
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_568784
Protein GI	91976125
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.450016
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCG CCTCGGCGCC GCTGCGGATC CTGATCACCG GCGCCACCGG CTTCGTCGGG 
CCGCATCTGG CGGCGGCGAT CCGGCAACGC TTCGGCGATC GCGCCGAACT CACCGCGACT 
GCGCTGGATG CCGGCGACGA CGCCGTCCTC GGCGCGATCA AGGCTCTCGA CGTCACCGAC 
CGCGACGCGG TCGAGGCGAT GATCGGCGAC CTGCAGCCCA CCCACCTCGT CAATCTAGCA 
GCGCTCGCCG CCCCCGCGGC CGCCAATGCC GATCCGGCGC TGGGTTGGCG CGTGCATCTC 
GACGGCCCGC GCAATCTCGG CCACGCCATC CTGGCCGCCG CCCCGGCCTG CGTGCTGGTG 
CATATCGGAT CGGGCCTCGC TTATGGCCGA ACCGCGTCGG ACCGGCCCGC GACCGAGCAG 
ACCGTGCTGG CGCCGCGCGA CGACTACGGC GCATCGAAAG CCGCGGCCGA TCTCGCGCTC 
GGCGCGCTGG TCGCGAAGGG GCTGCGCTGC GTCCGATTCC GGCCGTTCAA CCACACCGGC 
CCCGGGCAGA CCGACGCGTT CGTCGTGCCG GCTTTCGCCC GGCAGATCGC CCAGATCGAG 
GCCGGTGTCG CGCCGCCGCT GCTGCGGGTC GGCAATCTCG ACGGCCAGCG CGACTTTCTC 
GACGTCCGCG ACGTCGCCGC CGCCTATGTC GAGGCGATCG CCCGCAGCGA GCTGCTGGAG 
CCCGGCCTGA TCCTCAACGT CGCCTCCGGC CTCCCGCGCC GGATCGGCGA CATCCTGCAG 
CAATTGCTGG CGCTGACGCC GGAGCCGATC GACGTGCAGC GCGATCCGGC GCGCGACCGC 
GCCGACCCCG CCGACATCAT CGTCGGCGAT GCGACCCGCG CCTGCACGCT GCTCGACTGG 
AATCCGACCA TCGACTTCGC CACCACCATC GCCGACGTCC TGAACGATCA GCGCGCGCGG 
ATCGGACGGC GGGCGGAGTA A

Protein sequence

MASASAPLRI LITGATGFVG PHLAAAIRQR FGDRAELTAT ALDAGDDAVL GAIKALDVTD 
RDAVEAMIGD LQPTHLVNLA ALAAPAAANA DPALGWRVHL DGPRNLGHAI LAAAPACVLV 
HIGSGLAYGR TASDRPATEQ TVLAPRDDYG ASKAAADLAL GALVAKGLRC VRFRPFNHTG 
PGQTDAFVVP AFARQIAQIE AGVAPPLLRV GNLDGQRDFL DVRDVAAAYV EAIARSELLE 
PGLILNVASG LPRRIGDILQ QLLALTPEPI DVQRDPARDR ADPADIIVGD ATRACTLLDW 
NPTIDFATTI ADVLNDQRAR IGRRAE