Gene Sbal223_3099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3099
Symbol
ID	7087877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	-
Start bp	3677729
End bp	3678820
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	47%
IMG OID	643461983
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_002359007
Protein GI	217974256
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000350527
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.119927
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACAAG ATACGATTAA CAACGTACAC ATTAGTTCAG AGAAAGTTTT AATCACGCCG 
CAAGAGCTTA AAAATGCCTT GCCACTCTCT GAGCATGCTT ATCGTTATAT CCTCAATGCC 
CGCAAAACCG TGGCTGATAT CGTCCATAAG CGCGACAATC GAGTATTGAT CGTCACGGGG 
CCATGCTCTA TCCATGATAT CGCCGCCGCA AAAGAATACG CTTTAAGGCT TAAAACCTTG 
CACGATGAAC TCAGTGATGA GTTTTACATC TTAATGCGAG TGTACTTTGA AAAGCCGAGG 
ACTACGGTAG GTTGGAAAGG CATGATCAAC GATCCCGATA TGGATGAATC CTTCGATGTC 
GAAAAGGGTC TGAAAATGGC CCGTGAGCTG ATGATTTGGT TGGCCGAATT AGGGCTACCA 
GTCGCCACTG AAGCGCTTGA TCCTATCAGC CCTCAGTACA TTTCTGAGCT AGTGACTTGG 
TCGGCCATTG GGGCCCGAAC CACAGAATCG CAAACCCATA GGGAAATGGC ATCGGGTCTT 
TCTATGCCAG TAGGCTTTAA AAATGGCACC GATGGTAAGC TCGATGTGGC GATTAATGCG 
CTAAAATCAG CAGCCAGCAG TCACAGATTT ATGGGCATTA ACCAACAGGG CCAAGTCGCC 
TTATTACAAA CTGCGGGCAA TCCCGATGGT CATGTGATTT TACGCGGCGG TGCAACACCC 
AACTACGATG CCGCAAGCGT GGCAGAATGT GAGGCGCAGC TTCATAAAGC CAAACTCAAT 
GCACGTTTGA TCATCGATTG CAGCCATGGC AATTCATCCA AAGACTACAG CCGCCAAAAG 
CCTGTGTGTG AAGATGTGTT CGAGCAGATT TATAATGGCA ATAAATCGAT CATCGGCGTC 
ATGCTTGAAA GCCATTTAAA TGAAGGCAAT CAAAGCTGCG ATAAGCCATT AAGCGAGTTA 
GCTTATGGTG TATCTGTGAC AGATTCCTGT ATTAACTGGG AAAAAACAGA AACCATTTTA 
CGTGACGGCG CGGTGAAGTT ATCTTCAATA CTCCCGGCAC GCTTCGATAT GCTTAAAGTA 
GCTAACGCTT AA

Protein sequence

MQQDTINNVH ISSEKVLITP QELKNALPLS EHAYRYILNA RKTVADIVHK RDNRVLIVTG 
PCSIHDIAAA KEYALRLKTL HDELSDEFYI LMRVYFEKPR TTVGWKGMIN DPDMDESFDV 
EKGLKMAREL MIWLAELGLP VATEALDPIS PQYISELVTW SAIGARTTES QTHREMASGL 
SMPVGFKNGT DGKLDVAINA LKSAASSHRF MGINQQGQVA LLQTAGNPDG HVILRGGATP 
NYDAASVAEC EAQLHKAKLN ARLIIDCSHG NSSKDYSRQK PVCEDVFEQI YNGNKSIIGV 
MLESHLNEGN QSCDKPLSEL AYGVSVTDSC INWEKTETIL RDGAVKLSSI LPARFDMLKV 
ANA