Gene Sala_0810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0810
Symbol
ID	4080360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	815749
End bp	817083
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	70%
IMG OID	638009171
Product	homoserine dehydrogenase
Protein accession	YP_615863
Protein GI	103486302
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0112934
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCCCT ATGCCACCCC GACCGCTCCC CGCCCGCCGC TCCGCGTCGC GCTTGCCGGG 
ATCGGCGTCG TCGGCGGCGG GGTGGTAAGG CTGCTCGAGG CGAACCGCGC CCTGATCGCG 
CGGCGCGCGG GTCGGCCGAT CGAGATTGTC GCGGTGTCTG CGCGCGACCG GCACAAGGAT 
CGCGGCGTCG ACCTGTCGCG CTATCGCTGG GAAGACGATA TGGACGCGCT CGTCGCGGCG 
GGCGATGTCG ATGTCGTCGT CGAGATGATC GGCGGCGCCG ACGGATCGGC GCTGACGCTG 
GCGCGCCGCG CGCTGGGCGC GGGCAAGGCG CTGGTCACAG CGAACAAGGC GATGATCGCG 
CATCACGGGA TCGATCTCGC CCGGATCGCC GAAGAAAAGG ACACGCCGCT GAAATACGAA 
GCCGCTGTCG CGGGCGGCAT CCCTGTCATC AAGGCGATCC GCGAAGGCGC GTCGGCGAAC 
GAGATCGCGC GCGTCTATGG CATCCTCAAC GGCACCTGCA ATTATATCCT GACGCAAATG 
GAACGGAATG GCGCGAGCTT CGCCGATGCG CTGGCCGCCG CGCAGGCCGA GGGCTATGCC 
GAGGCCGACC CGAGCTTCGA TGTCGATGGC ATCGACGCCG CGCACAAGCT GTCGATTCTC 
GCCGCGCTCT GTTTCGGGAC GCGGCTCGAC ATCGGCGCGG TGACTGCCGA CGGCATCCGG 
GGCCTGATCG CGGCCGACAT CCGCGAGGCC GAGGCGCTGG GGCACCGCGT CCGCCTGATC 
GGCATGGCCG AGCGCGACAG CGCCGGGAAC GGCGGCGCCC TCTATCAGCA TGTCCAGCCG 
TGCCTGGTGC CCGCCGACCA TCCGCTCGCC TATGTGCCCG GCGCGCTGAA CGCCGTGGTC 
GCCGAGGGCA ATTTTGTCGG CCGCCTGTTC TTCGAGGGCG CCGGCGCCGG GGCAGGACCG 
ACCGCTTCGG CGATCGTGGC CGACATCATC GACATCGCGC GCGACGAATA TGGCCCGGCC 
TTCGCGATGC CGGTCGATGC ACTCGACGCG GCGCCCGCCG CCGATGCCGG CGCGCGCGTC 
GGCAAACATT ATGTCCGCCT GATCGTCGAG GACCGGATCG GCGTGCTCGC CGAGATCGCG 
GCGGCGATGC GCGACGCCGG CGTGTCGATC GAAAGCCTGA TCCAGCGCGG CAGCGAAGAC 
GGTGACGACG GCGTCGTCAT CGTGCTCGTC ACCCATGAAG GCCCGGCAAG CGCGATCCAT 
GCGGCGCTCG CGATTCTGGC GGGGTCGGAC CATGTCGTCG GCGCGCCGAT GCTGATGCCG 
ATCCTGGCGC TCTAA

Protein sequence

MSPYATPTAP RPPLRVALAG IGVVGGGVVR LLEANRALIA RRAGRPIEIV AVSARDRHKD 
RGVDLSRYRW EDDMDALVAA GDVDVVVEMI GGADGSALTL ARRALGAGKA LVTANKAMIA 
HHGIDLARIA EEKDTPLKYE AAVAGGIPVI KAIREGASAN EIARVYGILN GTCNYILTQM 
ERNGASFADA LAAAQAEGYA EADPSFDVDG IDAAHKLSIL AALCFGTRLD IGAVTADGIR 
GLIAADIREA EALGHRVRLI GMAERDSAGN GGALYQHVQP CLVPADHPLA YVPGALNAVV 
AEGNFVGRLF FEGAGAGAGP TASAIVADII DIARDEYGPA FAMPVDALDA APAADAGARV 
GKHYVRLIVE DRIGVLAEIA AAMRDAGVSI ESLIQRGSED GDDGVVIVLV THEGPASAIH 
AALAILAGSD HVVGAPMLMP ILAL