Gene Sala_1810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1810
Symbol
ID	4082201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1906291
End bp	1907814
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	69%
IMG OID	638010185
Product	aldehyde dehydrogenase
Protein accession	YP_616855
Protein GI	103487294
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGAG CGAAAGGCTG GGCAATGGCC GGGATCGGCG AAGAGATCGG GCAATTGCTC 
GACGGGTTGG ACGTGGACCG TGCGCTGTGG ACCGACGGGT CGATGCCCGC GGCGACGCCG 
CTGACGGGCG AGCGTCTCGG CAGGGTGCGG GTCGCTGATG CCGCTGCGAT CGATCAGGCG 
CTGGACAGGG CGACCTCGGC CTTTCGCGCC TGGCGCCATG TCCCTGCACC GCGGCGCGGC 
GAACTGGTGC GACTGTTCGG CGAGGAATTG CGCGCCGCGA AGGATGATCT GGCGCGGCTG 
GTGACGATCG AGGCGGGCAA GATTCCGTCC GAAGGCGCGG GCGAGGTGCA GGAGATGATC 
GACATCTGCG ACTTCGCGGT CGGTCTTTCG CGGCAATTAT ACGGCCTCAC CATCGCGACC 
GAGCGACCGG GGCACCGGAT GATGGAGGTG TGGCACCCGC TGGGCGTCGT CGGGGTGATT 
TCGGCGTTCA ATTTTCCCGT CGCGGTGTGG GCGTGGAATG CGGCGCTCGC ACTCGTGTGC 
GGCAACAGCG TGGTGTGGAA ACCGTCCGAA AAGACGCCGC TGACGGCGCT CGCGACGCAG 
GCGATTTTCG AGCGTGCGCT CGCGCGCTTC GGCGAGGCGC CCGAAGGTTT GTCGCAACTG 
CTGATCGGCG GGCGTGAGGC GGGCGAGGCG CTGGTCGATG ACCGCCGCGT CGCGCTCGTT 
TCGGCGACGG GATCGACCCG CATGGGCCGC GCGGTCGCGC CGCGGCTGGC GCAGCGCTTT 
GCGCGAGCGA TCCTCGAGCT GGGCGGCAAT AATGGCGTGA TCGTCGCCCC CTCGGCCGAC 
CTCGACCTCG CGCTGCGGGG GGTCGCGTTC GGCGCGATGG GGACGGCGGG GCAGCGCTGC 
ACGACGACGC GGCGGCTGTT CGTTCACGAC AGCATTTACG ATGCTTTCGT CGCGCGATTG 
AAGGCCGCCT ATGCCAGCGT CGCGGTCGGC AATCCACTGG AGAACGACGT TCTCGTCGGG 
CCGCTGATCG ATCGCGCCGC CCATGACGCG ATGCAGGATG CGCTGGCCGC GGCGAAGGCG 
GCGGGCGGCG TCGTGCAGGG CGGCGAACGG GTCGGCGAGG GCGCCGCCTA TTATGTCCGT 
CCGGCGCTCG TCGAGATGCC GGGACAGGTC GGGCCGGTGC TGGAGGAGAC GTTCGCGCCG 
ATCCTCTATG TCATGCGTTA TGACGATCTG GACGCCGCGA TCCGGCTGCA CAATGATGTC 
GCCGCGGGGC TGTCGTCGGC GATCTTCACC ACCGACATGC GCGAGGCCGA GCGCTTTCTC 
GCGGCGAGCG ATTGCGGCAT CGCGAACGTC AATCTGGGGA CGAGCGGCGC CGAGATCGGC 
GGGGCGTTCG GCGGCGAGAA GGAAACCGGC GGCGGTCGCG AAAGCGGGTC GGATGCGTGG 
CGCCAATATA TGCGGCGCGC CACGAACACG ATCAACTATT CGGACGCGCT GCCGCTGGCG 
CAGGGGGTGT CGTTCGCGCT CTAG

Protein sequence

MTRAKGWAMA GIGEEIGQLL DGLDVDRALW TDGSMPAATP LTGERLGRVR VADAAAIDQA 
LDRATSAFRA WRHVPAPRRG ELVRLFGEEL RAAKDDLARL VTIEAGKIPS EGAGEVQEMI 
DICDFAVGLS RQLYGLTIAT ERPGHRMMEV WHPLGVVGVI SAFNFPVAVW AWNAALALVC 
GNSVVWKPSE KTPLTALATQ AIFERALARF GEAPEGLSQL LIGGREAGEA LVDDRRVALV 
SATGSTRMGR AVAPRLAQRF ARAILELGGN NGVIVAPSAD LDLALRGVAF GAMGTAGQRC 
TTTRRLFVHD SIYDAFVARL KAAYASVAVG NPLENDVLVG PLIDRAAHDA MQDALAAAKA 
AGGVVQGGER VGEGAAYYVR PALVEMPGQV GPVLEETFAP ILYVMRYDDL DAAIRLHNDV 
AAGLSSAIFT TDMREAERFL AASDCGIANV NLGTSGAEIG GAFGGEKETG GGRESGSDAW 
RQYMRRATNT INYSDALPLA QGVSFAL