Gene TM1040_2655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2655
Symbol
ID	4077958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2789859
End bp	2791367
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	65%
IMG OID	638007979
Product	aldehyde dehydrogenase
Protein accession	YP_614649
Protein GI	99082495
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGAA CAGCAGACGA TATCCTGAAG AACCTGGGCC TGACGGCGGC AGAGCTGAGC 
GGTGGCAGCC GCGCGGTGCG CTCGCCCATT GATGGCAGCA CGCTGGCCGA GGTCCACGAC 
ACACCCGCAG GCGAGATGCC CGCGATTCTG GACCGCGCAC AGTCCGCGTT CAAGGCGTGG 
CGCGTGGTGC CCGCCCCGCG GCGCGGTGAG CTCATTCGCC TGCTCGGTGA AGAGCTGCGC 
GCGGCCAAGG AGGACCTTGG CGCGCTGGTC AGCTGGGAAG CGGGCAAGAT CACCTCTGAA 
GGCCTTGGCG AAGTGCAGGA GATGATCGAC ATCTGCGACT TTGCGGTGGG TCTGTCGCGC 
CAGCTTTATG GTCTGACGAT TGCCTCGGAA CGTCCCGGCC ACAGCATGCG CGAGACATGG 
CATCCGGCGG GGCCTGTGGG CGTGATCTCG GCGTTCAACT TTCCGGTTGC GGTCTGGTCG 
TGGAACGCGG CGCTGGCGAT TGTCTGCGGC GATCCGGTGA TCTGGAAACC GTCGGAGAAA 
ACACCGCTGA CGGCGCTGGC CTGCACCAAG ATCTTTGAAC GCGCGGTGAA ACGCTTTGGC 
GAGGATGCGC CCGAGGGCCT GCTGCAGATC CTGATCGGCG ATGCGGAGCT GGGCAAGGAG 
CTGGTCGCCA GCCCATCCGT GCCGGTGATT TCGGCCACGG GGTCGACCCG CATGGGCCGC 
GCGGTGGCAC CTGTGGTGGC AGAGCGGTTT GGCAAATGCA TTCTCGAACT GGGCGGCAAT 
AACGCGATGA TCGTGGCCCC GTCGGCGGAT CTGGAAATGG CAGTGCGGGC GATCGTGTTC 
TCTGCCGTGG GCACCGCCGG TCAGCGCTGC ACCTCGCTGC GCCGCCTGAT CGTGCACAAC 
TCCATCCGCG CGGATCTGGT GAAGCGCCTG AAGGCCGCCT ATGCCGGTCT GCCGATTGGT 
GATCCGCAGG CCGCGGGCAC GCTGGTTGGC CCGCTCGTGG ACGAGGCCGC AGGGGATGCG 
ATGATCTCTG CGCTGAAGGC GGCCGAGAGC GAGGGCGGCA CGGTGCATGG TGGCGCGCGT 
GTCACCGAGG GCGTGCCCGC AGGCGGTGTC TATATGGCGC CCGCCATCGT CGAGATGCCC 
GGTCAGAGCG CGTCGGTCAA AGAAGAGACC TTTGCGCCGA TCCTATACGT CATGGGCTAT 
GACGATTTTG AGGACGCGGT GGAGATGCAG AACGACGTGC CGCAAGGGCT GAGCTCCTGC 
GTGTTCACGC TCAATATGCG CGAGGCGGAG AGTTTCCTCA CCGCAGCCGG GTCCGATTGT 
GGCATTGCCA ATGTGAACAT TGGGCCGTCG GGCGCGGAAA TCGGCGGTGC CTTTGGCGGC 
GAGAAGGAAA CCGGTGGTGG GCGCGAGAGC GGCTCTGACG CGTGGAAATC CTACATGCGC 
CGCCAGACCA ACACCGTGAA TTATTCGGCG GAATTGCCGC TGGCGCAGGG TGTGAAGTTC 
GACATCTAA

Protein sequence

MARTADDILK NLGLTAAELS GGSRAVRSPI DGSTLAEVHD TPAGEMPAIL DRAQSAFKAW 
RVVPAPRRGE LIRLLGEELR AAKEDLGALV SWEAGKITSE GLGEVQEMID ICDFAVGLSR 
QLYGLTIASE RPGHSMRETW HPAGPVGVIS AFNFPVAVWS WNAALAIVCG DPVIWKPSEK 
TPLTALACTK IFERAVKRFG EDAPEGLLQI LIGDAELGKE LVASPSVPVI SATGSTRMGR 
AVAPVVAERF GKCILELGGN NAMIVAPSAD LEMAVRAIVF SAVGTAGQRC TSLRRLIVHN 
SIRADLVKRL KAAYAGLPIG DPQAAGTLVG PLVDEAAGDA MISALKAAES EGGTVHGGAR 
VTEGVPAGGV YMAPAIVEMP GQSASVKEET FAPILYVMGY DDFEDAVEMQ NDVPQGLSSC 
VFTLNMREAE SFLTAAGSDC GIANVNIGPS GAEIGGAFGG EKETGGGRES GSDAWKSYMR 
RQTNTVNYSA ELPLAQGVKF DI