Gene Saro_1086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1086
Symbol
ID	3916382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1128972
End bp	1129958
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	68%
IMG OID	640443821
Product	homoserine kinase
Protein accession	YP_496365
Protein GI	87199108
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID	[TIGR00938] homoserine kinase, Neisseria type

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGTCT ATACCCAGAT CGGCGCCGAG GACATGGCCG CGCTCGTCGC CGAGTTCGAC 
GTGGGCGAAC TCGTTTCGGC CAAGGGCATC GCCGAGGGCG TGTCGAACAG CAACTGGCTG 
CTCGACACCA CCGGGCGCGA CGGCAAGGGC GCGCGGTTCA TCCTGACGAT GTACGAATTC 
CGCATCGAGC TGGAAGACCT GCCGTATTTC CTCTCGCTGC TCGATCACCT TGCTGGGCGC 
GGCTGCGCGG TGCCGCGCAC GATCCACGAC CGCGCAGGCG CGCTCTACCG CATGCGCGGG 
GACAAGGCGC TGGCGCTCAT CGAGTTCCTG CCCGGCGTCT CGGTCAGCGA GCCGACCCCG 
GCGCAGGCCC GCGCCGTGGG CACGGCGCTG GCGCAGATGC ACCTGGCCTC TGCCGACTTC 
GCCGGCTCGC GAGAAAACGG GATGGGACTG GCGGAATGGC AGCGTCTGTT CGATGCCTGC 
GGGGCGGAAG GGCTGGCACG GATCGACCCC GACCTTGCCG GACTGGTGGC AGAACACATG 
CCCCGCATCG CGGCGCAATG GCCCGCCGAC CTGCCGCGCT CGGTCATCCA TGCGGACCTC 
TTCCCCGACA ACGTGCTGAT GCTGGGCGAC AAGGTCACCG GCCTCATCGA CTTCTACTTC 
GCCTGCAACG ACATCATGGC CTACGATGTG GCGGTCACCC ATGCGGCGTG GTGCTTCGAC 
GGCAGCGGGC GGAGCTTCGA TCCGGCCGTC TCGGCGGCGC TGCTCGAAGG CTACGAGTCG 
GTGCGGCCAC TGCTGCCGGA AGAGCGCGCG GCCCTGCCGC TGCTGGCGCA GGGCGCGGCG 
ATGCGCTTCA CATCGAGCCG GGCCTATGAC TGGCTGAATA CGCCGGCCGA CGCGCTGGTG 
GTGCGCAAGG ACCCGATGGC GTTCGCCCGG CGGCTGCAAT TCTACGCCGC CAATCCCGCC 
ATATTCGACA CGAATGCTTT CGCGTGA

Protein sequence

MAVYTQIGAE DMAALVAEFD VGELVSAKGI AEGVSNSNWL LDTTGRDGKG ARFILTMYEF 
RIELEDLPYF LSLLDHLAGR GCAVPRTIHD RAGALYRMRG DKALALIEFL PGVSVSEPTP 
AQARAVGTAL AQMHLASADF AGSRENGMGL AEWQRLFDAC GAEGLARIDP DLAGLVAEHM 
PRIAAQWPAD LPRSVIHADL FPDNVLMLGD KVTGLIDFYF ACNDIMAYDV AVTHAAWCFD 
GSGRSFDPAV SAALLEGYES VRPLLPEERA ALPLLAQGAA MRFTSSRAYD WLNTPADALV 
VRKDPMAFAR RLQFYAANPA IFDTNAFA