Gene Sala_1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1201
Symbol
ID	4080696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1241820
End bp	1243028
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	60%
IMG OID	638009562
Product	saccharopine dehydrogenase
Protein accession	YP_616250
Protein GI	103486689
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1748] Saccharopine dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.150944
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGG TTCTGGTGAT CGGCGCAGGC GGCGTCGGTT CGGTCGCGGT GCACAAGATG 
GCGATGAACT CCGACATCTT TCCCGACATC ACCCTCGCCA GCCGCCGCAA GTTCAAGTGC 
GACGCGATTG CCGGGTCGGT GAAGGCGCGT ACCGGCGTCA CGATCAAGAC CGCCGAGGTC 
GACGCCGACC ATATCGACGC GACCGCGGCG CTGATCCGTC AGATTGGCGC CACGCACGTC 
GTCAATCTTG CGCTGCCTTA TCAGGATCTG ACGATAATGG AGGCGTGCCT TTCGACCGGC 
GCGCATTATC TCGACACCGC AAATTACGAA CCGCGCGACG AGGCGAAGTT CGAATATCAC 
TGGCAATGGG CCTATCACGA CCGCTTCAAG GACGCGGGCC TGATGGCGCT GCTCGGCTCG 
GGCTTCGACC CCGGCGTGAC GAGCGTGTTC ACGACCTGGC TTCGCAAGCA TCATTTCGAC 
CGCATCGACA CGCTCGACAT CCTCGACTGC AACGGCGGCG ATCACGGCCA GCATTTCGCG 
ACCAACTTCA ACCCCGAAAT CAACATTCGT GAAGTCACCG CGGTCGCGCG CCACTGGGAA 
AATGGCGACT GGGTCGAAAC GCCCCCGATG TCGGTGAAGC AGCAGTTCCA TTTCGAAGGC 
GTGGGGCCGA AGAATATGTA CCTCATGTAT CATGAGGAGA TCGAAAGCCT GAAAACGCAT 
TTGCCCGAAA TCAAGCGCAT CCGTTTCTGG ATGACCTTTG GCGACGCTTA TATCCAGCAC 
CTTACCGTGC TCCAGAATGT CGGCATGACG CGGATCGATC CGGTGGTCTA CGAGGGCAAG 
GAGATCGTTC CGCTCCAGTT CCTCAAAGCC GTGCTCCCCG AACCGGCGAG CCTTGGCGGG 
ACGACGAAAG GCAAGACCAA TATCGGCGTC ATCGCGACCG GCCTTGGCAA GGATGGCAAG 
GAAAAGACGC TCTACCTCTA CAATATCTGC GACCATGAGG ATGCCTATGC AGAAACGGGC 
AATCAGGCGG TCAGCTACAC CACCGGCGTT CCCGCGATGA TCGGCGCCGC AATGATGGTC 
ACCGGTACGT GGGGCGGCGC GGGCGTCTTC AACATGGAAC AGATGGACCC CGATCCCTTC 
ATGGACATGC TGATGAAACA TGGTCTGCCG TGGCAGGTGA AGGAACTGGA CGCGCCGCTC 
GATTTCTGA

Protein sequence

MSKVLVIGAG GVGSVAVHKM AMNSDIFPDI TLASRRKFKC DAIAGSVKAR TGVTIKTAEV 
DADHIDATAA LIRQIGATHV VNLALPYQDL TIMEACLSTG AHYLDTANYE PRDEAKFEYH 
WQWAYHDRFK DAGLMALLGS GFDPGVTSVF TTWLRKHHFD RIDTLDILDC NGGDHGQHFA 
TNFNPEINIR EVTAVARHWE NGDWVETPPM SVKQQFHFEG VGPKNMYLMY HEEIESLKTH 
LPEIKRIRFW MTFGDAYIQH LTVLQNVGMT RIDPVVYEGK EIVPLQFLKA VLPEPASLGG 
TTKGKTNIGV IATGLGKDGK EKTLYLYNIC DHEDAYAETG NQAVSYTTGV PAMIGAAMMV 
TGTWGGAGVF NMEQMDPDPF MDMLMKHGLP WQVKELDAPL DF