Gene Shewana3_3379 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_3379
Symbol
ID	4478512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	+
Start bp	4050318
End bp	4051358
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	51%
IMG OID	639727988
Product	aldo/keto reductase
Protein accession	YP_871008
Protein GI	117921816
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATACA GACGCATACC GCATTCTAAT CTCGAGGTGA GCAAAATCTG TTTAGGCACT 
ATGACTTGGG GTGAACAAAA TACCCAAGCC GAAGCCTTCG CACAGCTAGA CTACGCCATC 
GGCAGTGGCA TCAACTTTAT TGACACTGCG GAAATGTACC CTGTGCCGCC AAAGCCAGAA 
ACCCAAGGGG AAACCGAGCG CATTTTGGGC CAATACATTA AGGCCCGTGG CAACCGTGAT 
GACCTAGTGA TCGCCACTAA GATTGCCGCA CCCGGCGGCA AGAGTGACTA TATTCGCAAA 
AATATGGCGC TGGACTGGAA CAATATCCAT CAAGCGGTCG ATGCTTCACT CGAACGCCTG 
CAAATCGATA CTATCGATCT CTACCAAGTG CATTGGCCAG ACCGCAATAC CAACTTCTTC 
GGGGAATTAT TTTACGACGA ACAAGAGATT GAGCAGCAAA CGCCAATCCT CGAGACCCTC 
GAAGCCCTCG CCGAAGTGAT TCGCCAAGGT AAAGTGCGCT ATATCGGCGT ATCGAACGAA 
ACCCCTTGGG GACTAATGAA GTATCTGCAA CTGGCGGAAA AACACGGCCT GCCGCGCATT 
GTGACTGTGC AAAACCCCTA TAACCTGCTC AACCGCAGCT TTGAAGTGGG CATGAGTGAA 
ATCAGCCATC GCGAAGAGTT GCCACTGCTG GCTTACTCGC CCTTGGCCTT TGGTGCCTTA 
AGCGGTAAAT ATTGCAATAA CCAATGGCCA GAAGGCGCGC GCTTAACCCT GTTTAAACGC 
TTCGCCCGTT ACACGGGTTC GCAAATGGCG CTCGATGCCA CCGCAGCTTA TGTAGACTTA 
GCCCGCGAGT TTAATCTCTC CCCCGCGCAA ATGGCGTTAG CCTTTGTTAA CTCACGTAAA 
TTTGTTGGCT CAAATATCAT TGGCGCCACG GACTTATACC AGCTGAAAGA GAATATCGAC 
AGCTTAAAGG TCAGCCTCTC CCCCGAGTTA CTCAGCCGTC TCAATGCACT CTCAGATCAA 
TTTAGATTGC CCTGCCCTTA G

Protein sequence

MEYRRIPHSN LEVSKICLGT MTWGEQNTQA EAFAQLDYAI GSGINFIDTA EMYPVPPKPE 
TQGETERILG QYIKARGNRD DLVIATKIAA PGGKSDYIRK NMALDWNNIH QAVDASLERL 
QIDTIDLYQV HWPDRNTNFF GELFYDEQEI EQQTPILETL EALAEVIRQG KVRYIGVSNE 
TPWGLMKYLQ LAEKHGLPRI VTVQNPYNLL NRSFEVGMSE ISHREELPLL AYSPLAFGAL 
SGKYCNNQWP EGARLTLFKR FARYTGSQMA LDATAAYVDL AREFNLSPAQ MALAFVNSRK 
FVGSNIIGAT DLYQLKENID SLKVSLSPEL LSRLNALSDQ FRLPCP