Gene Sala_3049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_3049
Symbol
ID	4082898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	3200419
End bp	3201912
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	66%
IMG OID	638011435
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_618086
Protein GI	103488525
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.205238
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACAGA TCGACCATCA CATTGTCGGC GGGGCCGCCG GTTCCGCCCG CTTCGGCGAC 
GTCTTCGACC CCAATAATGG CGGCGTGCAG GCGCGGGTCG CGCTCGGCGA TCGCGCCATC 
CTCGACCGCG CCGTGGCGGC GGCAAAGGCC GCGCAGCCCG CGTGGGCCGC GACCAACCCG 
CAGCGCCGCG CGCGCGTGAT GTTCGATTTC AAGCGCCTCG TCGAAGCCAA TATGAACCAG 
CTCGCCGAAA TGCTGTCGAG CGAACATGGC AAGGTGATCG CGGACTCGAA GGGCGACATC 
CAGCGCGGCC TCGAAGTCAT CGAGTTCTGC TGCGGCATCC CGCATGTGTT GAAGGGCGAA 
TATACGCAGG GTGCGGGCCC CGGCATCGAC GTCTATTCGA TGCGCCAGCC GGTCGGCATC 
GGCGCGGGGA TCACGCCGTT CAACTTCCCC GCGATGATCC CGCTGTGGAT GGGGGGCGTC 
GCGACCGCGG TGGGCAACGC CTTCATCCTG AAGCCCAGCG AGCGCGACCC GTCGGTGCCC 
GTGCGCCTGT CGGAACTCTT CCTCGAAGCC GGGATGCCCG AGGGGATTTT CCAGACCGTC 
CACGGCGACA AGGAAATGGT CGACGCGATC CTCGACCATC CCGACATCGG CGCGGTCAGC 
TTCGTCGGTT CGTCGGACAT CGCGCATTAT GTCTATAATC GCGGCGTTGC GAACGGCAAG 
CGCGTGCAGG CAATGGGCGG GGCCAAGAAC CATGGCATCG TCATGCCCGA CGCCGATCTC 
GACCAGGTGG TGAACGACCT GACCGGCGCG GCCTTCGGCT CGGCGGGCGA ACGCTGCATG 
GCGCTGCCCG TCGTCGTTCC CGTCGGTGAG GACACCGCGA ACCGCCTGCG CGCAAAACTC 
GTCCCCGCGA TCGAGGCGCT GCGCGTCGGC GTGTCGACCG ATACCGAGGC GCATTACGGC 
CCGGTGGTGA CAGAGGCGCA CAAGGAAAAG GTCGAAGGCT GGATCGCCAA ATGCGCCGAC 
GAAGGTGCCG AGCTGGTCAT CGACGGCCGC GGCTTCACGC TGCAGGGCCA CGAAAAGGGC 
TTCTTCGTCG GCCCGACGCT GTTCGACCAT GTCACCCCCG ACATGGAATC ATACAAGGAA 
GAGATTTTCG GCCCCGTGCT CCAGATCGTC CGCGCGCCCG ATTTCGAAAC CGCGCTCGAA 
CTGCCGTCGA AGCATCAATA TGGCAATGGC GTCGCGATCT TTACGCGCAA CGGCCACGCC 
GCGCGCGAAT TTGCGGCGCG GGTCAATGTC GGCATGGTCG GCATCAACGT GCCGATCCCG 
GTGCCGGTCG CCTATCACAG CTTCGGCGGC TGGAAACGGT CGGCGTTCGG CGACACCAAC 
CAGCATGGCA TGGAAGGCGT GAAGTTCTGG ACCAAGGTGA AGACCGTGAC CGCGCGCTGG 
CCCGACGGAT CGCCTGATGG CGGCAACGCC TTCGTTATCC CGACGATGGG TTGA

Protein sequence

MRQIDHHIVG GAAGSARFGD VFDPNNGGVQ ARVALGDRAI LDRAVAAAKA AQPAWAATNP 
QRRARVMFDF KRLVEANMNQ LAEMLSSEHG KVIADSKGDI QRGLEVIEFC CGIPHVLKGE 
YTQGAGPGID VYSMRQPVGI GAGITPFNFP AMIPLWMGGV ATAVGNAFIL KPSERDPSVP 
VRLSELFLEA GMPEGIFQTV HGDKEMVDAI LDHPDIGAVS FVGSSDIAHY VYNRGVANGK 
RVQAMGGAKN HGIVMPDADL DQVVNDLTGA AFGSAGERCM ALPVVVPVGE DTANRLRAKL 
VPAIEALRVG VSTDTEAHYG PVVTEAHKEK VEGWIAKCAD EGAELVIDGR GFTLQGHEKG 
FFVGPTLFDH VTPDMESYKE EIFGPVLQIV RAPDFETALE LPSKHQYGNG VAIFTRNGHA 
AREFAARVNV GMVGINVPIP VPVAYHSFGG WKRSAFGDTN QHGMEGVKFW TKVKTVTARW 
PDGSPDGGNA FVIPTMG