Gene Sala_0902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0902
Symbol
ID	4082802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	910795
End bp	912270
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	64%
IMG OID	638009263
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_615953
Protein GI	103486392
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.864011
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTTC TGAAATATGC CGACGCCATC TATGTGGGCG GCGAATGGGA GAAGACCGAT 
CGGCGCGAGG CGGTGATCAA CCCCGCGGAC GAAAGTCTGC TGATCGAGGC ACCGGTCGGC 
AGCGCGCGGC AGGTCGAAGC CGCAATCGGC GCTGCTCGCC ATGCTTTCGA CAGAAGCGAC 
TGGTCGCATC TGCCGGTCGC CGAACGGCAG AAAATCCTGA CCCGCTTTCT GGACGCGCTG 
GATGCCCGCA AGGGCGCAAT CGTCGACATG ATCGTTGCCG AGGCGGGCGC GACGCGGATG 
CTGGCGGAGT TCCTGCAATA TGGCATCCCG ATGAAACATG CGCGGCGCAC GGTGGAACTG 
GCATCGCGGC CCGCCGTCAC CCCGCTGCCC GTCGAACTCA CGCCGAACGC GCAGGGCCGC 
ACAACGCTGG GCACCGGCGT GGTCAGCCGC GAGCCGGTCG GGGTGGTGGC CGCCATTTCC 
CCCTATAATT TCCCCTTCTT CCTGAACGTC GGCAAGGTCG TTCCGGCGCT TGCGGTGGGC 
TGCACGGTGG TTCTGAAGCC GTCGCCCTAC ACCCCGATGG AAGCGCTGAT CCTGGGCGAA 
ATCGCCGACG AGGTGGGATT GCCGAAAGGC GTTCTCAGCA TCGTGACCGG CGACATCGAA 
ACCGGCAAGC TGCTCACCAC CGATCCGCGC GTCGATCTGG TGCATTTCAC CGGGTCGGAC 
AAGGTCGGCG CGATGATCCA GGCGCAGGCG GCGCCGACGC TGAAACGGAT CGTGATGGAA 
CTGGGAGGCA AATCGGCGCT GATCGTCCGC AGCGACGCGG ACATTCAAAA GGCCGCCGCA 
GCGGGATTGA TGGGGTTCAC CACCCACTGC GGCCAGGGCT GCGCGCTCAC CACCCGCCAT 
TTGGTCCACA ACAGCGTCCG GCCGCAATTT GTCGAAGCGC TGAAAGGGAT GCTGACGCAT 
ATCAGGATCG GCAACCCCGC CGACCCCGCG GTCAATTACG GCCCGTTGAT CCGCGAAGTC 
GCGCGCAAAC GGACCGAGGA TTATGTCGCA ATCGCCCGCG ACGAGGGCGC GACGCTGGTG 
TCGGGCGGAA AACGCCCGGA AGGGCTGGAC AAGGGCTTTT ATTTCGAGCC GACGCTGTTC 
GACAATGTCA AGAATGACAG CCGGCTGGCC CAGGAAGAGG TTTTCGGACC GATCGGGGCG 
GTCATCGGTT TCGACGATGA CGACGAAGCG ATTGCCCTGG CCAATGCCAG CGATTTTGGC 
CTGTCCGGCG CGATCTATTC GGCCGATGCC GGGCAGGCCT ATCGGATGGC GCTCAAAATC 
CGGACCGGCG GCGTATCGAT CAACGGCGGC GCCGGCACGA TGCAGTCCGA TGCCCCCTTC 
GGCGGTATCA AGCGGTCGGG CTATGGCCGC GAATATGGCG AGGATGGCCT GAACGAATTC 
ACCTATCAAA AGGTGATCGG TTTCCACGCC GAATAG

Protein sequence

MPFLKYADAI YVGGEWEKTD RREAVINPAD ESLLIEAPVG SARQVEAAIG AARHAFDRSD 
WSHLPVAERQ KILTRFLDAL DARKGAIVDM IVAEAGATRM LAEFLQYGIP MKHARRTVEL 
ASRPAVTPLP VELTPNAQGR TTLGTGVVSR EPVGVVAAIS PYNFPFFLNV GKVVPALAVG 
CTVVLKPSPY TPMEALILGE IADEVGLPKG VLSIVTGDIE TGKLLTTDPR VDLVHFTGSD 
KVGAMIQAQA APTLKRIVME LGGKSALIVR SDADIQKAAA AGLMGFTTHC GQGCALTTRH 
LVHNSVRPQF VEALKGMLTH IRIGNPADPA VNYGPLIREV ARKRTEDYVA IARDEGATLV 
SGGKRPEGLD KGFYFEPTLF DNVKNDSRLA QEEVFGPIGA VIGFDDDDEA IALANASDFG 
LSGAIYSADA GQAYRMALKI RTGGVSINGG AGTMQSDAPF GGIKRSGYGR EYGEDGLNEF 
TYQKVIGFHA E