Gene Sbal195_3686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal195_3686
Symbol
ID	5755500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS195
Kingdom	Bacteria
Replicon accession	NC_009997
Strand	+
Start bp	4349487
End bp	4350527
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	50%
IMG OID	641290028
Product	aldo/keto reductase
Protein accession	YP_001556107
Protein GI	160876791
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0158243
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATACA GACGCATACC GCATTCTAAT CTCGAGGTCA GCAAAATCTG TTTGGGCACT 
ATGACTTGGG GCGAACAAAA TACCCAAGCC GAAGCATTTG CACAGCTGGA CTACGCCATA 
GGAAATGGCA TCAACTTTAT CGATACGGCG GAAATGTATC CCGTCCCACC TAAGCCCGAA 
ACCCAAGGGG AAACAGAGCG TATTCTTGGG CAATATATTA AGGCTCGCGG CAACCGTGAC 
GATCTAGTTA TTGCCACTAA AATTGCCGCA CCGGGTGGTA AGAGTGATTA TATTCGCAAG 
AATATGGCGC TGGACTGGAA CAACATCCAT CAAGCGGTCG ATGCCTCCTT AGCGCGCCTC 
CAAATCGACA CTATCGATCT TTATCAAATC CATTGGCCCG ACCGAAATAC CAACTTCTTT 
GGTGAACTGT TTTACGATCA ACAGGATCAA GAACATCAAA CCCCGATCCT CGAAACCCTT 
GAAGCCCTCG CCGAAGTCAT TCGCCAAGGT AAAGTGCGCT ATATCGGTGT GTCGAACGAA 
ACACCTTGGG GCTTGATGAA GTACCTGCAA CTCGCCGAAA AACACGGTCT GCCGCGTATT 
GTGAGTGTGC AAAACCCTTA TAACTTGCTC AATCGCAGCT TCGAAGTCGG CATGAGCGAA 
ATCAGCCACC GCGAAAACCT GCCGCTGCTC GCTTACTCAC CACTGGCCTT TGGCGCCTTA 
ACCGGCAAAT ACTGCAACGA CCAATGGCCC GAAGGTGCAC GCCTGACCTT GTTTAAGCGT 
TTCGCCCGTT ACACAGGTTC GCAAATGGCA CTGGAGGCCA CGCAAGCCTA CGTCGATTTA 
GCCCGCGAGT TCAAACTCAC GCCCGCACAA ATGGCGCTAG CCTTTGTTAA CTCACGTCAG 
TTTGTCGGCT CCAACATTAT CGGCGCCACC GACTTGTATC AACTGAAAGA AAATATCGAC 
AGCCTGAAAG TCACCTTATC GTCAGAGCTA TTAGTGCGAT TAAACGAACT ATCCGATAAA 
TTCAGATTAC CTTGCCCTTA G

Protein sequence

MEYRRIPHSN LEVSKICLGT MTWGEQNTQA EAFAQLDYAI GNGINFIDTA EMYPVPPKPE 
TQGETERILG QYIKARGNRD DLVIATKIAA PGGKSDYIRK NMALDWNNIH QAVDASLARL 
QIDTIDLYQI HWPDRNTNFF GELFYDQQDQ EHQTPILETL EALAEVIRQG KVRYIGVSNE 
TPWGLMKYLQ LAEKHGLPRI VSVQNPYNLL NRSFEVGMSE ISHRENLPLL AYSPLAFGAL 
TGKYCNDQWP EGARLTLFKR FARYTGSQMA LEATQAYVDL AREFKLTPAQ MALAFVNSRQ 
FVGSNIIGAT DLYQLKENID SLKVTLSSEL LVRLNELSDK FRLPCP