Gene RPD_3928 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3928
Symbol
ID	4024444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4367125
End bp	4368288
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	66%
IMG OID	637964132
Product	glucose sorbosone dehydrogenase
Protein accession	YP_571050
Protein GI	91978391
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACAC TTCTGGTCTG GGTCTCCGGC ACGCTGACCG CGGCGACGGT GATCATTGCA 
TCGTCCCTGA TCGCGACGAA AAGCAGCGGC CAACCGACCT CGTTCGGCTC GTCCGCAGGC 
GCGCTCGATG TGAAGACGTT CGCGCAGAAT CTCGTCAATC CCTGGGCTTT GGCCTTTCTG 
CCAGAGGGGC GCGTGCTGGT CACCGAGAAG CCGGGACGAA TGCGCGTGGT GTCGGCGCAG 
GGAGCGCTGT CAACGCCGTT GAAAGGCGTT CCCGAGGTCT GGCCCGCAGG CCAGGGCGGC 
CTGCTCGACG TTGCCACCGA CAAGGACTTC GCCGGCAACA AGACGATCTA TCTCTGTTAC 
GCCGAGCGCA CCGGCAATGG CGGCCGCACG GCGGTTGCGC GCGCCGCCCT GGTCGACGGC 
GACGCGCCCC GTCTCGACGC TGTCGAGGTG ATCTTTCGCC AGGACGGCCC GCTGTCGCCG 
GGCAATCACT ATGGCTGCCG GATCGCACAG GGCGCCGACG GCAATCTGTT CGTCTCCCTC 
GGCGATCACT TCGCCCATCG CGACGAGGCG CAGAACCTCG GCAATCATCT CGGCAAGATC 
ATTCGCATCG CGCCGGACGG CAGCGTGCCC AAGGATAATC CGTTCGTTGG CCGCGCCGAC 
GCCAAGCCGG AGATCTGGAG CTACGGCCAC CGCAACGCGC AGGCGCTCGC CATCAATCCC 
GCCAACGGCC AATTGTGGGA GATCGAGCAC GGCCCGCGCG GCGGCGACGA AGTCAACATG 
ATCGGCCCCG GCAAGAACTA CGGCTGGCCG GTGATCGGCT ACGGCATCGA TTACAGCGGC 
GCCAAAATCC ACGACAGCAC GTCGAAGCCC GGCATGGAGC AGCCGATCAA ATATTGGGTT 
CCGTCGATCG CGCCGTCCGG CATGGCGTTC TACACAGCCA AGCTGTTTCC GAAGTGGGAC 
GGCAGCCTGT TCACCGGCGC CCTCGCCGGC AAGATGCTGG TGCGGCTGTC GCTCTCTGGC 
GACAAGGTGA CCGGCGAGGA ACGTCTGCTG CTGGCGCTGA ACGAACGCAT CCGCGACGTC 
CGCCAGGGCC CTGACGGCGC GCTATGGCTG CTCACCGACA ACGCCGCGGG CCGCATCCTG 
CGCGTGACGC CGACGGGCGA GTGA

Protein sequence

MKTLLVWVSG TLTAATVIIA SSLIATKSSG QPTSFGSSAG ALDVKTFAQN LVNPWALAFL 
PEGRVLVTEK PGRMRVVSAQ GALSTPLKGV PEVWPAGQGG LLDVATDKDF AGNKTIYLCY 
AERTGNGGRT AVARAALVDG DAPRLDAVEV IFRQDGPLSP GNHYGCRIAQ GADGNLFVSL 
GDHFAHRDEA QNLGNHLGKI IRIAPDGSVP KDNPFVGRAD AKPEIWSYGH RNAQALAINP 
ANGQLWEIEH GPRGGDEVNM IGPGKNYGWP VIGYGIDYSG AKIHDSTSKP GMEQPIKYWV 
PSIAPSGMAF YTAKLFPKWD GSLFTGALAG KMLVRLSLSG DKVTGEERLL LALNERIRDV 
RQGPDGALWL LTDNAAGRIL RVTPTGE