Gene Sbal223_3036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3036
Symbol
ID	7088945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	-
Start bp	3596238
End bp	3597701
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	50%
IMG OID	643461920
Product	betaine aldehyde dehydrogenase
Protein accession	YP_002358944
Protein GI	217974193
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01804] glycine betaine aldehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0986408
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGTAG AAGTACAGTA CAACTTTATA GCGGGTCAGT TGCTCGCTAA CGATAGCGGC 
GAAACCTTCG ACGTCGTCAA TCCTGCCACT GGGCAATTGG CGTACCGAGT GCAAGTGGCC 
GATGAAAAAA TTCAGCAAGC GGCCATTGAG AGCGCCAAAA AAGGCTTTGC GATTTGGTCT 
GCCATGAGTG CCACTGAACG CAGTCGTATT CTGTTAAACG CGGTTGCGTT ATTGCGCGAT 
CGTAATGATG AACTCGCGGC AATCGAAGTG CGTGACACAG GTAAACCTTG GCAAGAAGCC 
TCAGTGGTTG ATGTGGTCAC AGGCGCAGAT GCCATTGAGT TTTTCGCCCA TATTGCCCCT 
GGGCTTGAAG GCGCACAGCA GCAAGTCGGT GGAGATTTTT ATTACACCCG TCGTGAGCCC 
TTAGGCATTT GTGCTGGCAT TGGCGCGTGG AATTACCCAT TACAAATCGC CTGTTGGAAG 
GCCGCTCCTG CCTTAGCCAG CGGCAATGTG ATGATTTTTA AACCTTCGGA AGAAACGCCG 
CTTGGCGCAC TGAAATTAGC GCAACTCTTA AGTGAGGCGG GTTTGCCCGA TGGCGTATTT 
AACGTCGTGA TGGGCGATGG CAAGGTTGGC GCTTGGTTAA CGGGACATCC GGATATTGCC 
AAAGTGTCTT TCACTGGTGA AGTCGGTACT GGCAAAAAAG TCATGGCCGC GGCGGCAAGT 
TCATTAAAAG ACGTCACTAT GGAACTCGGC GGTAAATCAC CGCTTATCGT GTTTGACGAT 
GCTGATATCG ACAATGCGGT TTCAGGTGCC ATGCTCGGTA ACTTCTACAC CCAAGGTGAA 
GTCTGCACCA ATGGGACGCG AGTGTTTGTC CATGAGTCGG TTTATCAAGA CTTTATTGAG 
AAGCTGCTCG CCCGTACCCA AGCCAATATT GTGGTGGGCG ATCCTATGGC GCCAGAGACT 
AACTTTGGCG CGTTGATTTC TAAAGATCAT CAGCAAAAAG TGCTCGATTA TATTCAGCAA 
GGTATCGATG ACGGCGCAAC TCTGCTCACT GGTGGCACAG CGTTAACGCC TGAAAACGCT 
CCCAATGGTT ACTTTGTCGC CCCAACCATT TTTACCGATT GCACCGACGA GATGCGTATT 
TGCCAAGAGG AAATCTTTGG CCCTGTGATG TCGGTACTCA CCTTTAAAGA TGAAGCCGAA 
GTGATTGCTC GGGCAAACAA TACCGCCATG GGCTTAGCTG CTGGGGTGTT CACCCAAGAT 
ATCAGCCGTG CACATCGGGT TATTCATCAG TTACAAGCGG GTATTTGCTG GATCAATGCC 
TATGGTGCAT CGCCAGCAGA AATGCCTGTA GGTGGGTATA AGTTGTCGGG TATTGGCCGT 
GAAAACGGTA GCGAGACACT CAAGCATTAC ACCCAAGTTA AAGCCGTTTA CGTGGGTCTA 
CAGCCCTTAG AAAGCCCATT TTAA

Protein sequence

MSVEVQYNFI AGQLLANDSG ETFDVVNPAT GQLAYRVQVA DEKIQQAAIE SAKKGFAIWS 
AMSATERSRI LLNAVALLRD RNDELAAIEV RDTGKPWQEA SVVDVVTGAD AIEFFAHIAP 
GLEGAQQQVG GDFYYTRREP LGICAGIGAW NYPLQIACWK AAPALASGNV MIFKPSEETP 
LGALKLAQLL SEAGLPDGVF NVVMGDGKVG AWLTGHPDIA KVSFTGEVGT GKKVMAAAAS 
SLKDVTMELG GKSPLIVFDD ADIDNAVSGA MLGNFYTQGE VCTNGTRVFV HESVYQDFIE 
KLLARTQANI VVGDPMAPET NFGALISKDH QQKVLDYIQQ GIDDGATLLT GGTALTPENA 
PNGYFVAPTI FTDCTDEMRI CQEEIFGPVM SVLTFKDEAE VIARANNTAM GLAAGVFTQD 
ISRAHRVIHQ LQAGICWINA YGASPAEMPV GGYKLSGIGR ENGSETLKHY TQVKAVYVGL 
QPLESPF