Gene Sbal223_3204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3204
Symbol
ID	7085817
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	3798810
End bp	3800300
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	52%
IMG OID	643462088
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_002359112
Protein GI	217974361
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.887195
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAAGA TCACTCACTT TGTTAATGGT CAGCACACTC CTGCCAGTAC CAGAACCCAA 
GATATTTTTG AACCAGCCAC GGGTGAACTA CGTGGCCAAG TCTCACTCGC AAGCGAAACT 
GAAGTGGGTG AAGCCATCGC AATCGCTAAA ACCGCCTTTG AAACATGGTC GCAGGTGACG 
CCGCTCAACC GTGCTCGAGT GCTATTTAAA TTCAAAGCCT TAGTTGAGCA GAACCTAGAT 
GAAATGGCGC AGCTTATCAC CCGCGAGCAC GGCAAAGTGA TCGACGATGC TAAGGGCGAG 
TTGATCCGTG GTCTCGAAGT GGTCGAGTTT GCCTGTGGTA TTCCGCACTT GCTTAAAGGT 
GAACACACCC AGCAAGTCGG TGGCGGGGTC GATTCTTGGT CAGTTAATCA AGCTTTAGGT 
GTTGTCGCAG GCATAGCGCC CTTTAACTTC CCCGTGATGG TTCCCATGTG GATGTTCCCA 
ATCGCGATTG CCTGCGGTAA CACCTTTATT ATGAAACCCT CAGAAAAAGA CCCAAGCTCG 
GTGATGCGTA TTGCCGATCT GCTTAAAGAA GCGGGTCTTC CCGATGGCGT GTTTAACGTG 
ATTAACGGCG ACAAAGAAGC CGTCGATACC TTACTCACCC ATAAAGATGT GCAAGCGGTG 
AGCTTTGTAG GCTCAACGCC GATTGCCGAA TACATCTACA GCACAGCCTC TAAACATGGC 
AAACGCGTGC AAGCCTTAGG CGGCGCGAAA AACCATATGT TACTCATGCC AGATGCGGAT 
TTAGATCAAG CCGTTAGCGC CTTAATGGGC GCAGCTTACG GCAGTGCTGG TGAGCGTTGT 
ATGGCGATTT CTGTCGTACT TGCGGTAGGC GATGTGGGTG ACGCGTTAGT GGAAAAACTG 
CTACCGCAAA TCCAAACCTT AAAAGTCGGC AACGGCCTAA CGCCAGAGAT GGAAATGGGT 
CCGCTGATCT CAAAACAGCA CCTTGCCAAG GTCACCCAAT ATGTTGAAGC CGGTGTGCAA 
GAAGGCGCAG CGCTGCTGGT CGATGGCCGT AAACTGAGTG TTGAAGATCA TCAACAGGGT 
TATTTCCTCG GCGCCTGTTT GTTCGACCAC GTCACGCCTG AAATGAGCAT CTACCGCGAA 
GAAATCTTTG GCCCAGTGCT GGCGATTGTG CGCGTGAAAG ATTACCCAAC GGCGCTTGAG 
CTGATTAACC AACACGAATT TGGCAATGGC ACGGCGATTT TCACCCAAAG TGGTGAAGCG 
GCGCGACATT TTTGCCACCA CGTGCAAGTC GGTATGGTTG GAGTGAACGT GCCGATCCCG 
GTGCCAATGG CGTTCCACAG TTTTGGCGGT TGGAAGCGAT CACTCTTTGG GCCGCTGCAT 
ATGCATGGTC CAGATGGCGT GCGTTTTTAT ACCAAACGTA AGGCAATTAC TGCCCGCTGG 
CCCGTAGGTA AACAGACTCA AGCCGAGTTT GTGATGCCTA CGATGAAATA G

Protein sequence

MLKITHFVNG QHTPASTRTQ DIFEPATGEL RGQVSLASET EVGEAIAIAK TAFETWSQVT 
PLNRARVLFK FKALVEQNLD EMAQLITREH GKVIDDAKGE LIRGLEVVEF ACGIPHLLKG 
EHTQQVGGGV DSWSVNQALG VVAGIAPFNF PVMVPMWMFP IAIACGNTFI MKPSEKDPSS 
VMRIADLLKE AGLPDGVFNV INGDKEAVDT LLTHKDVQAV SFVGSTPIAE YIYSTASKHG 
KRVQALGGAK NHMLLMPDAD LDQAVSALMG AAYGSAGERC MAISVVLAVG DVGDALVEKL 
LPQIQTLKVG NGLTPEMEMG PLISKQHLAK VTQYVEAGVQ EGAALLVDGR KLSVEDHQQG 
YFLGACLFDH VTPEMSIYRE EIFGPVLAIV RVKDYPTALE LINQHEFGNG TAIFTQSGEA 
ARHFCHHVQV GMVGVNVPIP VPMAFHSFGG WKRSLFGPLH MHGPDGVRFY TKRKAITARW 
PVGKQTQAEF VMPTMK