Gene pE33L466_0299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	pE33L466_0299
Symbol	iolG
ID	3399733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_007103
Strand	+
Start bp	297501
End bp	298526
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	38%
IMG OID	637660123
Product	myo-inositol 2-dehydrogenase
Protein accession	YP_245787
Protein GI	67078167
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000000146369
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTTT TAACGATTGG GATTATTGGT GCTGGACGAA TTGGGAAACT GCATGTTGAT 
AATTTGCGGC TGATGCCACA AGTAAAAATT AAAGCAGTTT CAGATGTAGT AATCAGTCAT 
CTAGAAAAGT GGGCTCAAGA TAAAGGGATT TCCACTCTGA CTACAAACTA TCAGGATTTA 
TTAGCAGATC CAGAAATTGA TGCTGTATTT ATTTGTTCAC CAACAAATAC ACATGCGCAA 
ATTATTAAAG AAGCGGCTCT TGCGAAAAAA CATATTTTCT GCGAAAAGCC TGTTAGTTTC 
TCGGTAGAAG AAACATTAGA AGCATTAGAG GTGGTAAAAG AACAAGGAGT ATCTCTTCAA 
GTAGGTTTTA ACCGCCGTTT CGATCCTAAC TTCAGAAAGG TCTATGATCT TATTCAACAA 
GGAGAAGTGG GACAGCCACA TATTTTAAAA ATTACGTCTA GAGATCCACA ACCACCAAGT 
ATAGAGTATG TTCGTTCTTC AGGTGGATTG TTTATGGATA TGATGATTCA TGACTTTGAT 
ATGGCTAGGT ATGTGATGAA TAGTGAAGTT GTTGAAGTAT TTGCATATGG AACAACATTA 
ATTGATCCGT CCATTCAGGA AGTAAATGAT GTTGATACAG CAATTGTCAC ATTGAAATTT 
GCGAATGGAG CTTTAGGGGT AATTGATAAT AGCCGCCAAG CTGTTTATGG ATATGACCAG 
CGTGTTGAAG TGTTTGGTGA AAAAGGCGCA GTCGCTGCGG AGAATTGCTG CCCGACAACA 
GTACAAGTTT CAAAAACAGA AGGTGTTGTA AAAGATAAGC CGCTTTATTT CTTCTTAGAG 
CGCTATACGC AGGCTTACAT TGAAGAAGTA ACACAATTTA CAAAGTCAAT TATAAAAGGA 
CAAGCTGTTA TTTGCAGTGG TAATGATGGG TTACAAGCAG AACGAATTGC GAAAGCTGCC 
AAGGAATCCT TACTAACAGG AAAACCCGTT CAAATTGAAC ATAAACAACC TGCATTAAAT 
CAGTAA

Protein sequence

MNVLTIGIIG AGRIGKLHVD NLRLMPQVKI KAVSDVVISH LEKWAQDKGI STLTTNYQDL 
LADPEIDAVF ICSPTNTHAQ IIKEAALAKK HIFCEKPVSF SVEETLEALE VVKEQGVSLQ 
VGFNRRFDPN FRKVYDLIQQ GEVGQPHILK ITSRDPQPPS IEYVRSSGGL FMDMMIHDFD 
MARYVMNSEV VEVFAYGTTL IDPSIQEVND VDTAIVTLKF ANGALGVIDN SRQAVYGYDQ 
RVEVFGEKGA VAAENCCPTT VQVSKTEGVV KDKPLYFFLE RYTQAYIEEV TQFTKSIIKG 
QAVICSGNDG LQAERIAKAA KESLLTGKPV QIEHKQPALN Q