Gene Dshi_2082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2082
Symbol
ID	5713077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	2202111
End bp	2203370
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	65%
IMG OID	641268004
Product	putative sorbosone/glucose dehydrogenase
Protein accession	YP_001533420
Protein GI	159044626
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCAC TACTCGGGTC CGTGGCGCTG TGCGTCGCGG CGACCGGCGT CGCGCACGCG 
CAGGACAACA TGGAAAAATT GTCCAACATG CAGAAAACCG GCGCGACATT CACCTTCATC 
GATCAGGGCG GCGACCGGGC CGAGGCGCTG CGCAACATCA TCCAGCACAT CAACGTGCCC 
GACGGCTTCG AGGTCAGCCT CTATGCGGTT GTGCCCGATG CCCGCTCGAT GTCCATGGCG 
CCCCAGGGCA CCGTCCTGTT CGCCGGCACG CGCAAGGACA AGGTCTGGTC CATCGTCGAC 
CGGGATCGCG ACAGGGTCGC CGATGAGGTC AAGGACTTCG CGCCTTCGGT CACCTTCGAC 
ATCCCCAACG GGCCGTGTTT CTCGCCGGAC GGGTTCCTGT ACATCGCCGA GCGGAACCGC 
ATCCTGGTCT TCCCGGCTGC CGAGTTCTTC TTCGAGAGTC CGGATATCGC CGTGGGCACC 
GTGGTGCCGC AGGGCGAGTT GATCCCGGTC GAGGAAGAGA GCTTCAACCA CTCCGCCCGG 
GTGTGCGACA TCGGCCCGGA CGGCAAGCTT TATGTCTCGC TCGGCCAGCC GCACAACGTG 
CAGCCGCTGG ACAAGATCGA GATGTATGAC GAGATCGGCA TCGGCGGCAT CATCCGGATG 
AACACCGACG GCTCAGAGCG CGAGGTCTAT ACCCGCGGCG TGCGCAACTC GGTCGGGCAG 
GATTTCAACC CGGCGACGGG TGAGTTGTGG TGGACCGACA ACCAGGTCGA CGGGATGGGC 
GACGATATCC CGCCGGGCGA GTTGAACCGG CAGACCGAGG CGGGTCAGCA TTTCGGCTTC 
CCCTGGACCA ATGCCCGGGT CGAGATCGTC TCGGAGGCGG ATTTCCCCCG GCCCGAGGGG 
GTGACCTTTG TCGAGCCGCA ACTTGAGCTG ACCGCCCATG CGGCGGATCT GGGCATGCGG 
TTCTACCACG ACAGCAGCTT CCCCGAGGCG TATCATGGGG GCATCTTCTG GGCGCAGCAC 
GGGTCCTGGA ACCGCACCAC GCCGGTGGGC GCCCGGGTGA TGTTCACTGC CCTCGATCCC 
GAAACCGGGG ATGCGGTGGG CGCGGAGGTA TTCGCCGATG GCTGGCTGAA CGAAGAGACC 
GGCGAGTATC GCGGGCGTCC GATGGACATC GAATTCCTGC CCGATGGCTC GATGCTGGTC 
TCGGATGACT TCGCCGGGGC GATCTGGCGG ATCGCCTATG TTGGGATGCC CGCCGAATGA

Protein sequence

MKSLLGSVAL CVAATGVAHA QDNMEKLSNM QKTGATFTFI DQGGDRAEAL RNIIQHINVP 
DGFEVSLYAV VPDARSMSMA PQGTVLFAGT RKDKVWSIVD RDRDRVADEV KDFAPSVTFD 
IPNGPCFSPD GFLYIAERNR ILVFPAAEFF FESPDIAVGT VVPQGELIPV EEESFNHSAR 
VCDIGPDGKL YVSLGQPHNV QPLDKIEMYD EIGIGGIIRM NTDGSEREVY TRGVRNSVGQ 
DFNPATGELW WTDNQVDGMG DDIPPGELNR QTEAGQHFGF PWTNARVEIV SEADFPRPEG 
VTFVEPQLEL TAHAADLGMR FYHDSSFPEA YHGGIFWAQH GSWNRTTPVG ARVMFTALDP 
ETGDAVGAEV FADGWLNEET GEYRGRPMDI EFLPDGSMLV SDDFAGAIWR IAYVGMPAE