Gene Ssed_1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssed_1043
Symbol
ID	5610174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sediminis HAW-EB3
Kingdom	Bacteria
Replicon accession	NC_009831
Strand	-
Start bp	1237318
End bp	1238808
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	54%
IMG OID	640931891
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_001472782
Protein GI	157374182
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0205992
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.342071
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGACGA TCACCCATTT CATTAACGGC AGCCATACTG ACACAAGCGA GCGCACGGGT 
CAGGTTTTCG AACCCGCCAC CGGAGAGCAA ACAGCATCGG TATCCTTGGC CAGTGCGGCC 
GAAGTTGCCG GCGCTATCGA GTTAGCCAAG AGAGCACATA AGAGCTGGTC TCAGATCTCA 
CCACTCAATC GCGCCAGAGT CCTGTTTAAG TTCAAGGCGC TGGTCGAAAA CAATATCGAT 
GAGTTAGCAG AGCTTATCAC CCGGGAACAC GGCAAGGTAT TAGATGATGC CAAGGGCGAG 
ATCATTCGAG GCCTGGAGGT CGTTGAGTTT GCGTGCGGCA TTCCACATCT GCTTAAAGGC 
GAGCACACCG AGCAGGTAGG CACCGGCGTC GATGCCTGGC ATGTGAATCA ATCGCTCGGC 
GTCGTGGCCG GTATTGCTCC GTTCAACTTC CCGGTCATGG TTCCCATGTG GATGTTCCCA 
ATCGCGATTG CCAGTGGTAA CACCTTTATC ATGAAGCCAT CGGAGAAAGA TCCGAGCTCT 
GTGATGCGCC TGGCCGAACT GCTTAGTGAA GCGGGTCTGC CCGATGGTGT GTTCAATGTC 
GTAAACGGTG ATAAAGAGGC GGTCGATACC CTGCTGACCC ATAAAGATAT TCAAGCCGTG 
AGTTTCGTTG GCTCAACCCC TATCGCCGAA TATATCTATG AGACGGCATC TAAATACGGT 
AAACGTGTAC AGGCACTGGG TGGCGCGAAA AACCATATGT TACTCATGCC CGATGCCGAC 
TTAGATCAAG CCGTTGGCGC CTTGATGGGC GCAGCCTATG GTTCAGCCGG CGAGCGTTGC 
ATGGCGATAT CTGTGGTACT GGCGGTAGGC AACTCCGGCG ATGCACTGGT TGAAAAACTG 
CTGCCACAGA TTAAAGCATT GCGCGTGGGT AACGGAGTCA CTCCCGAGAT GGACATGGGG 
CCTTTGATCT CCGCGCAGCA TCTGGCCAAG GTCACCGACT ATGTCGAAAC CGGCGTGGCA 
GAAGGTGCCA CCCTCCTCGC CGATGGCCGG GAGTTAACGG TTGCAGATCA CGAGCAGGGC 
TATTTTCTCG GTGGCTGCCT GTTCGATAAT GTCACCCCTG AGATGACTAT CTACAAGGAG 
GAGATCTTCG GTCCGGTGCT GGCCATCGTC AGAGTCGATG ATTACGCCGA AGCGCTCGAA 
CTCATTAACG AACATGAATT TGGCAATGGC ACCGCCATCT TTACTCAAAG CGGCGAGGCG 
GCGAGACATT TCTGTCATCA CGTTCAGATT GGTATGGTCG GCGTTAACGT GCCGATCCCC 
GTTCCTATGG CTTTCCATAG CTTCGGTGGA TGGAAGCGTT CACTGTTTGG TCCGCTACAT 
ATGCATGGGC CCGACGGTGT TCGCTTCTAT ACCAAGCGTA AGGCTATTAC TGCCCGCTGG 
CCAAAACCAA AGCATGCTCA GGCTGAGTTT GTCATGCCAA CGATGAAGTA A

Protein sequence

MQTITHFING SHTDTSERTG QVFEPATGEQ TASVSLASAA EVAGAIELAK RAHKSWSQIS 
PLNRARVLFK FKALVENNID ELAELITREH GKVLDDAKGE IIRGLEVVEF ACGIPHLLKG 
EHTEQVGTGV DAWHVNQSLG VVAGIAPFNF PVMVPMWMFP IAIASGNTFI MKPSEKDPSS 
VMRLAELLSE AGLPDGVFNV VNGDKEAVDT LLTHKDIQAV SFVGSTPIAE YIYETASKYG 
KRVQALGGAK NHMLLMPDAD LDQAVGALMG AAYGSAGERC MAISVVLAVG NSGDALVEKL 
LPQIKALRVG NGVTPEMDMG PLISAQHLAK VTDYVETGVA EGATLLADGR ELTVADHEQG 
YFLGGCLFDN VTPEMTIYKE EIFGPVLAIV RVDDYAEALE LINEHEFGNG TAIFTQSGEA 
ARHFCHHVQI GMVGVNVPIP VPMAFHSFGG WKRSLFGPLH MHGPDGVRFY TKRKAITARW 
PKPKHAQAEF VMPTMK