Gene Sbal195_3301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal195_3301
Symbol
ID	5755105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS195
Kingdom	Bacteria
Replicon accession	NC_009997
Strand	-
Start bp	3891468
End bp	3892571
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	50%
IMG OID	641289634
Product	3,4-dihydroxy-2-butanone 4-phosphate synthase
Protein accession	YP_001555723
Protein GI	160876407
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00274465
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000125479
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGCGCTGC ACAGTATAGA AGAGATCATC GAAGATATTC GTCAAGGCAA AATGGTTATT 
TTGATGGATG ACGAAGACAG AGAAAACGAA GGTGATTTGA TCATGGCGGC CGAAATGGTA 
ACGCCAGAAG CGATTAACTT TATGGCGAAA TATGGCCGTG GACTCATTTG CCAGACCATG 
ACTAAAGCCC GTTGCCAGCA GTTAAATCTG CCCTTAATGG TGACGAATAA CAACGCCCAG 
TTCTCGACTA ACTTTACAGT TTCTATTGAA GCAGCCGAAG GCGTGACTAC CGGTATTTCG 
GCCCACGACC GCGCGGTAAC GGTAAAAACG GCCGTGGCTA AAGAGGCTAA AGCGTCTGAT 
TTAGTGCAAC CAGGGCATAT CTTCCCGTTA ATGGCACAGG ACGGCGGCGT ATTAACCCGC 
GCAGGGCACA CTGAAGCTGG TTGTGATTTA GCCCGTCTTG CGGGACTTGA GCCATCGGGC 
GTTATCGTTG AGATTTTGAA CGAAGACGGC ACTATGGCAC GCCGCCCAGA TTTAGAGATT 
TTCTCCGAGT TGCACGGCAT CAAAATCGGC ACCATCGCGG CATTGATCGA GTATCGCAAC 
ACCAAAGAAA CCACGGTTGT GCGTGAAGCT AAATGCAAAC TACCGACCCG TTTCGGTGAG 
TTCGACATGG TGACTTTCAG AGACACTATC GACAATCAAC TGCATTTTGC CTTAGTCAAA 
GGTGAGGTGA AGAGTGATTG TTTAGTGCGC GTGCATCTGC AAAACACTTT CAACGATTTA 
CTCCATTCAG AGCGCGATCA GCAACGCAGC TGGCCACTCG AAAAGGCGAT GGAGCGTATT 
TCTGCAGAAG GTGGCGTATT GGTTTTATTA GGGAATCAAG AACATCCCTG TGAAATCCTC 
TCTAAGGTGA AAGCCTTTGA AGCCGAAGAT CAAGGTCAAG CGCCTGCTTC TGCAAAATGG 
CAGGGGACGT CGCGCCGTGT GGGTGTGGGT TCGCAAATCC TCGCTAGCCT TGGCGTGACT 
AAGATGCGCC TGCTCAGCTC GCCTAAACGT TACCATTCAC TTTCGGGCTT TGGCCTTGAA 
GTGACTGAGT ATGTGGCGGA CTAA

Protein sequence

MALHSIEEII EDIRQGKMVI LMDDEDRENE GDLIMAAEMV TPEAINFMAK YGRGLICQTM 
TKARCQQLNL PLMVTNNNAQ FSTNFTVSIE AAEGVTTGIS AHDRAVTVKT AVAKEAKASD 
LVQPGHIFPL MAQDGGVLTR AGHTEAGCDL ARLAGLEPSG VIVEILNEDG TMARRPDLEI 
FSELHGIKIG TIAALIEYRN TKETTVVREA KCKLPTRFGE FDMVTFRDTI DNQLHFALVK 
GEVKSDCLVR VHLQNTFNDL LHSERDQQRS WPLEKAMERI SAEGGVLVLL GNQEHPCEIL 
SKVKAFEAED QGQAPASAKW QGTSRRVGVG SQILASLGVT KMRLLSSPKR YHSLSGFGLE 
VTEYVAD