Gene RPD_0619 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0619
Symbol
ID	4021088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	701286
End bp	702539
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	62%
IMG OID	637960807
Product	putative L-sorbosone dehydrogenase
Protein accession	YP_567758
Protein GI	91975099
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTCGA TCTTCAGACG ATCCGTTGTT GCATGCGCTG CAGTCCTGGC GATCGGGGCT 
CTCGATCAAG CTGTCGCTCA GGGCCTCAAG AAATACGATT CCGACAAGAA GGACTTCTGG 
ACCAACCCGC CGCCGGATTG GTTCCTCGGC GACGAGACCG AGGCGCAGAA GGGTCTCGCG 
CCGCCGGCCG GCCCGCCGAC CGGATCGTCC GATGCCGAAC TCGCCGCGAT GATGAAGAAG 
ATCAAGCTGC CGCCGGGCTT CAAGATCGAA GTCTACGCCT CGGGCGTGCT GGCGGCGCGG 
CAAATGGCCT GGGGCGACAA CGGCACGCTG TTCGTCGGCT CGTTCGGCCT CGGCAACGTC 
TATGCGATCA CCGAGAAGGA CGCCAAGAAA CAGGTCAAGA CCGTCCTCAA GGGCATGAAG 
ATGCCGACCG GCATCGCATT CCAGAACGGC GCGCTCTACG TGATCGATAT CGACAAGCTG 
ATCCGCTACG ACAACGCCGA AGCCAATCTC GACAAGCTCG GCGACGGCAA GGTCGTCTAT 
GACGACATGC CGTCTTACGT CGCGCACGGA TGGAAGTATC TCGCGGCGGA CAAGGACGGC 
TGGTTCTACG TGCCGTTCGG CCCGCCCTTC AACATCGGCC TGCCGCCGAC CTCGCTGTCG 
CAGATCCGCC GCATCGATCC CAAGACCGGC AACGCCGAAT TGGTCGCGCT CGGCGTGCGC 
AATTCGGTCG GCGGCGACGT CGATCCGCGC ACCGGCAAAT ACTGGTTCAC CGAAAACGCC 
CGCGACTGGA TCAGCGACGA CATGCCGAGC GACAAGCTCA ACATGATCTC GAAGCTCGGC 
GAGCATTTCG GCTATCCGTA TTGCCATCAG GGCGACATGC CGGACCCGAA ATTCGCGATG 
GGGCACAAAT GCTCCGAGTT CACGCCGCCG GTGCTGAACC TCGGCGCGCA TGTCGCTCCG 
CTCGGCATGA AGTTCTACAC CGGCGACCAG TTCCCCGCCG AGTACAAGAA CAACATCTTC 
ATCGCCGAGC ACGGCTCCTG GAATCGTCAC AAGTATCAGG GCGCGCTGAT CAAGCGCGTG 
ATCGTCGATC CGGACGGCAA GAACGCCAAG CAGGAAAACT TCGCCACCGG GTGGATCGAG 
GGCGACCAGG GCTATCTCGG CAGACCCGCC GACATCGTGC TGGCCAAAGA CGGTTCGATG 
CTGGTGGCGG ACGATTGGGC CGGCGCGATC TATCGCATCA GCTACAGCAA GTGA

Protein sequence

MKSIFRRSVV ACAAVLAIGA LDQAVAQGLK KYDSDKKDFW TNPPPDWFLG DETEAQKGLA 
PPAGPPTGSS DAELAAMMKK IKLPPGFKIE VYASGVLAAR QMAWGDNGTL FVGSFGLGNV 
YAITEKDAKK QVKTVLKGMK MPTGIAFQNG ALYVIDIDKL IRYDNAEANL DKLGDGKVVY 
DDMPSYVAHG WKYLAADKDG WFYVPFGPPF NIGLPPTSLS QIRRIDPKTG NAELVALGVR 
NSVGGDVDPR TGKYWFTENA RDWISDDMPS DKLNMISKLG EHFGYPYCHQ GDMPDPKFAM 
GHKCSEFTPP VLNLGAHVAP LGMKFYTGDQ FPAEYKNNIF IAEHGSWNRH KYQGALIKRV 
IVDPDGKNAK QENFATGWIE GDQGYLGRPA DIVLAKDGSM LVADDWAGAI YRISYSK