Gene Dret_0946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0946
Symbol
ID	8418766
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1119359
End bp	1120582
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	55%
IMG OID	645037513
Product	glucose sorbosone dehydrogenase
Protein accession	YP_003197812
Protein GI	258405070
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.415737
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.000365484
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACCAG TATGTTCTTC GATACAACAC CTGGTTCCTT TATTTATCCT GGTGTTATTG 
TCCATCCCGG CCGGAGCTGC CGACAACGCC GTGACGGGCA ATGCCGGGTC AACGCTTTAT 
GTTGAAAGTT TTGGGGCGTT TGATGAACCC TGGGCCATGT GCTTTCTGCC GAACAAAAAT 
CTGCTTGTCA CGGAGAAAAA AGGCAATCTG ATCCTGTTCA ATGTGGATGA CCGCACCCGG 
ACAGCGGTTC AGGGGGTGCC CAAGGTGGCC TACGGCGGCC AGGGGGGATT GGGGGATGTT 
ATTCTTCACC CGCAATTTGA GGACAACCAC TGGATATACC TTTCCTATGC TGAGCAGGAC 
GCATCAGGCA AGAAAGGTGC GGTTGTGATC CGGGCAACGC TTCGTTTCAA CGATGCCGGG 
CCTGCACTCG AAGGCCATCA GATTATCTGG AAACAGATCC CTAAAGTACC CGGCAGCGGG 
CACTACTCGC ACCGGCTGGC ATTCAGCCCG GACGGAAAAT TGTTCATCAC CTCTGGTGAT 
CGCCAAAAGC AGACCCCGGC CCAGGACTGG ACCCAGAATC TGGGCAAGGT TATCCGTTTA 
AACGAGGACG GATCTGTTCC GCCTGACAAC CCATTCCAGA ATAAGGGAGA CCTTGCCAAA 
ACCTTCTGGA CGCTGGGGCA CCGGAACATT CTGGGGATTG CCTTTGATCG CCAGGGCCGG 
CTGTGGACTC ATGAAATGGG ACCCAGGCAC GGGGACGAGT TCAACTTGAT TGTCAGGGGA 
GACAATTATG GTTGGCCCAT TGTTTCCTGG GGCGACCAGT ATTCAGGAAT TCCCATCCCT 
GATCATGACA CCCGCCCGGA ATTTAATGCA CCTGAAATGT ACTGGGTTCC CACCGTTGCC 
CCTTCAGGCC TGATTATCTA TGACGGTGCC CTTTTCCAGC AATGGCAGGG TGATGCATTC 
CTTGGCGGGC TGCGATCCCG ATCTCTGGTC CGCATTGAAA TGAACGGGAC CAAGGCCCAT 
GAGGCAGAAC GCTTTGCCAT GGGCAAACGC ATCCGGGAAA TTGAGCAGGG TCCAAATGGT 
GCCATCTGGC TTTTGGAGGA CAAACAGAAC GGCCGCTTGC TTCGGCTGAC GCCCAAGAAC 
GGCGAGATTG TTGATCGGAA TGCGTTGATA CCGGGTCGCA CGACAGGGGC CAATTGCTGC 
TTACAGCGGA GACTCGCAGG GTAA

Protein sequence

MKPVCSSIQH LVPLFILVLL SIPAGAADNA VTGNAGSTLY VESFGAFDEP WAMCFLPNKN 
LLVTEKKGNL ILFNVDDRTR TAVQGVPKVA YGGQGGLGDV ILHPQFEDNH WIYLSYAEQD 
ASGKKGAVVI RATLRFNDAG PALEGHQIIW KQIPKVPGSG HYSHRLAFSP DGKLFITSGD 
RQKQTPAQDW TQNLGKVIRL NEDGSVPPDN PFQNKGDLAK TFWTLGHRNI LGIAFDRQGR 
LWTHEMGPRH GDEFNLIVRG DNYGWPIVSW GDQYSGIPIP DHDTRPEFNA PEMYWVPTVA 
PSGLIIYDGA LFQQWQGDAF LGGLRSRSLV RIEMNGTKAH EAERFAMGKR IREIEQGPNG 
AIWLLEDKQN GRLLRLTPKN GEIVDRNALI PGRTTGANCC LQRRLAG