Gene Sde_2645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_2645
Symbol
ID	3968503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	3345939
End bp	3347384
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	48%
IMG OID	637921743
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_528117
Protein GI	90022290
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0237988
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.24266
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTC ATAACATGAA AAATTTTATC AACGGCGAAT ATATAGCTTC ACAAGCTGAT 
GGCGCTATTG ATGTGCTAAG CCCAAGCACC GGTAAAAAGG TAGGCGATAT TCCCGCAGGA 
TGTGTAGAGG ATGCGCAGTT GGCGCTGGAT ACAGCCAACG CAGCTCAAAA GCTGTGGGCA 
AAAAAAACGA ACAGAGAGCG CGCAAAAATA TTGCGTGTAT TCGCTGCGAA TATTCGTGCG 
GCGGCGGATG ATTTAGCCAA GCTGTTAGTG AGCGAGCAGG GTAAATTACT TTCTGTTGCG 
CAAATGGAAG TAGAAGCCAC AGCAACGTTT ATAGAATACG CGTGTGATAA CGCGCTTACT 
ATAGAGGGCG ATATTTTACC TTCCGATAAC CCCAACGAAA AAATATATAT CCACAAAGTG 
CCACGCGGTG TGGTTGTGGC AATTACCGCT TGGAATTTTC CGTTAGCACT GGCGGGCAGA 
AAAATAGGCC CAGCACTTGT TACAGGCAAT GCTATCGTGG TTAAGCCAAC CCAAGAAACG 
CCACTTGCAA CATTGGCGTT AGGCGAGCTA GCTAATGCTG CGGGTATTCC CGCCGGCGTA 
CTCAATATTG TAAACGGCCG TGGCAGTGTT GTTGGGCAGC ACCTGTGCGA AAGCCCAATA 
ACCCGCTTAA TAACCATGAC CGGCAGCACC CCTGCTGGGC AGCGTATTTA CCGCACCAGT 
GCCGATCATT TAACGCCAGT AATGCTAGAA CTGGGCGGTA AGGCACCATT TATCGTAATG 
GAAGATGCCA ACTTAGAAAG CGCAGTAGAG GCGGCATTTA CTACGCGTTA TGCCAATTGC 
GGGCAAGTGT GTACCTGTGC CGAGCGCCTG TATGTACACG AATCTATTTA CCCCGCTTTT 
ATGGATAAGC TACTTGAGAA GGTGAAAGCA ATAAAAGTGG GCGACCCAAT GGCTGCCGAT 
ACCGATATGG GTCCCAAGGT TAATCAAAGC GAAATAGAAA ATATTGATGC GCTGGTTAAG 
AAGGGTATTG AGCAAGGCGC AACCTTGCTG CATGGCGGTA AGCGCGCGCA TGTGCCTGGC 
TTTGAAGGTG GCAACTGGTA TGAACCCACA CTGCTAGGTG ATGTGCAGCA AAGTAATATT 
CTTGTGCACG AAGAAACGTT TGGGCCTATT TTACCTGTAG TTAAAATTAA CAGTATTGAG 
CAGGCTATAG AGTACACCAA CGACAGTGAG TATGGCCTTT CAACGTATTT GTTTACGCAA 
AACCTTAAAT ATATTCATCA ATATATTGCC GAGGTTGAGG CCGGTGAGGT GTATGTTAAC 
CGCGGTATTG GTGAGCAGCA CCAAGGCTTC CACAACGGTT GGAAGCTAAG CGGCGCAGGC 
GGTGAAGATG GTCGTTACGG TTTAGAGCAG TACTTAGAGA AGAAGACAGT GTATTTTGCT 
GAATGA

Protein sequence

MKIHNMKNFI NGEYIASQAD GAIDVLSPST GKKVGDIPAG CVEDAQLALD TANAAQKLWA 
KKTNRERAKI LRVFAANIRA AADDLAKLLV SEQGKLLSVA QMEVEATATF IEYACDNALT 
IEGDILPSDN PNEKIYIHKV PRGVVVAITA WNFPLALAGR KIGPALVTGN AIVVKPTQET 
PLATLALGEL ANAAGIPAGV LNIVNGRGSV VGQHLCESPI TRLITMTGST PAGQRIYRTS 
ADHLTPVMLE LGGKAPFIVM EDANLESAVE AAFTTRYANC GQVCTCAERL YVHESIYPAF 
MDKLLEKVKA IKVGDPMAAD TDMGPKVNQS EIENIDALVK KGIEQGATLL HGGKRAHVPG 
FEGGNWYEPT LLGDVQQSNI LVHEETFGPI LPVVKINSIE QAIEYTNDSE YGLSTYLFTQ 
NLKYIHQYIA EVEAGEVYVN RGIGEQHQGF HNGWKLSGAG GEDGRYGLEQ YLEKKTVYFA 
E