Gene Sbal223_3496 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3496
Symbol
ID	7088609
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	4155948
End bp	4156988
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	49%
IMG OID	643462380
Product	aldo/keto reductase
Protein accession	YP_002359401
Protein GI	217974650
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.496722
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATACA GACGCATACC GCATTCTAAT CTCGAGGTCA GCAAAATCTG TTTGGGCACT 
ATGACTTGGG GCGAACAAAA TACCCAAGCC GAAGCATTTG CACAGCTGGA CTACGCCATA 
GGAAATGGCA TCAACTTTAT CGATACGGCG GAAATGTATC CCGTCCCACC TAAGCCCGAA 
ACCCAAGGGG AAACAGAGCG TATTCTTGGG CAATATATTA AGGCTCGCGG CAACCGTGAC 
GATCTAGTTA TTGCCACTAA AATTGCCGCA CCGGGTGGTA AGAGTGATTA TATTCGCAAG 
AATATGGCGC TGGACTGGAA CAATATCCAT CAAGCGGTCG ATGCGTCACT CGAGCGCCTG 
CAAATCGATA CTATCGATCT CTACCAAGTT CATTGGCCCG ACCGTAATAC CAACTTCTTT 
GGTGAACTGT TTTACGAAGC GCAAGATCAA GAAACTCAAA CCCCAATCCT CGAAACCCTA 
GAAGCCCTCG CCGAAGTGAT CCGCCAAGGC AAAGTGCGCT ATATAGGAGT GTCGAACGAA 
ACGCCTTGGG GTTTGATGAA GTACCTGCAA CTGGCCGAAA AACACGGCTT GCCACGTATT 
GTGAGTGTGC AAAATCCCTA TAACTTGCTC AATCGCAGCT TCGAAGTCGG CATGAGCGAA 
ATCAGTCACC GCGAAAACTT GCCATTACTG GCCTATTCGC CACTGGCCTT TGGTGCCTTG 
ACGGGAAAAT ATTGCAACGA CCAATGGCCT GAAGGTGCAC GCCTGACCTT GTTTAAGCGT 
TTCGCCCGTT ACACAGGTTC GCAAATGGCA CTGGAGGCCA CGCAAGCCTA CGTCGATTTG 
GCCCGCGAGT TCAAACTCAC GCCAGCGCAA ATGGCGTTAG CCTTTGTTAA CTCACGTCAG 
TTTGTCGGCT CCAACATTAT TGGCGCCACC GACTTGTATC AACTGAAAGA AAACATCGAC 
AGCCTGAAAG TCACCTTATC GCCTGAGCTG TTAGTGCGAT TAAACGAACT GTCCGATAAA 
TTCAGATTAC CTTGCCCTTA G

Protein sequence

MEYRRIPHSN LEVSKICLGT MTWGEQNTQA EAFAQLDYAI GNGINFIDTA EMYPVPPKPE 
TQGETERILG QYIKARGNRD DLVIATKIAA PGGKSDYIRK NMALDWNNIH QAVDASLERL 
QIDTIDLYQV HWPDRNTNFF GELFYEAQDQ ETQTPILETL EALAEVIRQG KVRYIGVSNE 
TPWGLMKYLQ LAEKHGLPRI VSVQNPYNLL NRSFEVGMSE ISHRENLPLL AYSPLAFGAL 
TGKYCNDQWP EGARLTLFKR FARYTGSQMA LEATQAYVDL AREFKLTPAQ MALAFVNSRQ 
FVGSNIIGAT DLYQLKENID SLKVTLSPEL LVRLNELSDK FRLPCP