Gene Rpal_4812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4812
Symbol
ID	6412498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	5179509
End bp	5180672
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	67%
IMG OID	642714690
Product	glucose sorbosone dehydrogenase
Protein accession	YP_001993777
Protein GI	192293172
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCTC CGATCGTCTG GGTTTCCGGC ACGCTGAGCG CAGCCACCGC GCTGCTTGCC 
TCGCTGCTGA TCGTGACCGC CAGCCGCGGT GAGATCACCA CTTACGAATC CTCCGCAGGC 
CCGCTGACCG TCCAGACCGT GGCGCAGAAG CTGGTACACC CCTGGGGTCT GGCGTTTCTG 
CCTGATGGCC GGATGCTGGT GACTGAGCGC CCCGGCCGTC TGCGGCTGGT GACACCGCAG 
GGCCAGGTCT CGAAGCCTCT GCAGGGCGTG CCGGAGGTGT GGGCCTCGGG CCAGGGCGGA 
CTGCTCGACG TCGCGGCCGA CAAGGACATC GCCAGCAACC ACACGATCTA CCTGTGCTAC 
GCCGAGCGCG ACGGCAATGG CGGCCGGACC GCGGTGGCAC GTGCGTCTCT CGACACCGGC 
GATGCACCGC GGCTGAACGA CATCAAGGTG ATCTTCCGCC AGCAGGGGCC GCTGTCGTCC 
GGCAATCACT ATGGCTGCCG GATCGCGCAG GACGGCAGCG GCAATCTGTT CGTGACGCTC 
GGCGAGCACT ACGCGTATCG CGATCAGGCG CAGAGCCTGT CCAATCATCT GGGCAAGATC 
GTCCGCATTG CGCCGGACGG CAGCGTGCCC GACGGCAATC CGTTCGCCGG CCGCGAGGGC 
GCCGAGCCCG AACTCTGGAG CCTCGGCCAC CGCAATCCGC AGGGCCTCGC CTTCAACCCC 
GCCGACGGCA AACTGTGGGA GGTCGAGCAC GGCCCGCGCG GCGGCGATGA GGTCAACATC 
ATCCGCAAGG GTGAGAATTA CGGCTGGCCG GTGATCGGCT ACGGCATCGA CTATAACGGC 
GCCAAGATCC ACGAGGCGAC CGCTAAGCCG GGCATGCAGC AGCCCGCCAA ATATTGGGTG 
CCGTCGATCT CGCCGAGCGG GATGGCGTTC TACACCGGCA AGCTGTTTCC GACCTGGACC 
GGCAGCCTGT TCGTCGGCGC GCTGTCGGGA CAGATGCTGG TGCGGCTGTC GCTCGACGGC 
GACAAGATCA CCGGCGAAGA GCGGCTGTTG CAGACGCTGG ACGAACGCAT CCGCGACGTG 
CGTCAGGGGC CGGACGGTGC GCTGTGGCTC TTGACCGACA GCGACACCGG ACGCCTTCTG 
CGCGTCGTGC CAGCGGCCAA CTAA

Protein sequence

MKAPIVWVSG TLSAATALLA SLLIVTASRG EITTYESSAG PLTVQTVAQK LVHPWGLAFL 
PDGRMLVTER PGRLRLVTPQ GQVSKPLQGV PEVWASGQGG LLDVAADKDI ASNHTIYLCY 
AERDGNGGRT AVARASLDTG DAPRLNDIKV IFRQQGPLSS GNHYGCRIAQ DGSGNLFVTL 
GEHYAYRDQA QSLSNHLGKI VRIAPDGSVP DGNPFAGREG AEPELWSLGH RNPQGLAFNP 
ADGKLWEVEH GPRGGDEVNI IRKGENYGWP VIGYGIDYNG AKIHEATAKP GMQQPAKYWV 
PSISPSGMAF YTGKLFPTWT GSLFVGALSG QMLVRLSLDG DKITGEERLL QTLDERIRDV 
RQGPDGALWL LTDSDTGRLL RVVPAAN