Gene Saro_0544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0544
Symbol
ID	3918674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	593656
End bp	594798
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	69%
IMG OID	640443274
Product	galactokinase
Protein accession	YP_495825
Protein GI	87198568
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGCGC TGCATGACCG GCTCCTTGCC GGCTTTGCGC AAGCGTTCGG GGGAGAGCCG 
GAGCTTGTCG TGCGCGCGCC CGGCCGGGTG AACCTGATCG GCGAACATAC CGACTACAAC 
GACGGCTTCG CCATGCCCGT GGCAATAGGC CAGGAAACGC GCGTGGCCTT CCGCCCGGGC 
GGAACCGGGC TCAGGGTGGC CGCTCTGGAC TTTGCCGAAG ATGACGCGTT CGACAGCGCG 
GCCCCGCAAA GGGCCGGCGG CGGTTGGCGC GATTATGTGC GCGGCGTGGT GGACGAACTC 
GTCCGCGCGG GGATTTCCGT CCCTCCGGGC CAGCTTGCGA TCGCAGGATC GATTGCCAAG 
GGGACCGGCC TGTCATCCTC GGCCTCGCTC GAGGTTGCCG TCGCGCGTGT CCTGCTCGAT 
GCAGCGGGTG AACGGATGGA CCCCGTCAGC CTCGCGCTCC TTGCCCAGCG AGCGGAATGC 
GATTTCGTCG GCGTTCGCTG CGGCAATCTC GATCAGATTG CCAGTGCTGC CACGACGCGC 
GGCCACGCGC TGCTGATCGA TTGCCGCACC CTGGCGCTCA GGCAGATCGC CATGCCCGCC 
GACGTGGCGG TGATGATCGT GCAGTCAGGC GTGGTGCGCG GATTGGTGGA CGGCGAATAC 
AACCAGCGCC GGCAGGAATG CGAACGCGCC GCCCGGACGC TCGGCGTGCC GGCGCTGCGC 
GACGTCGACG AGGGGATGCT CGACGAGGCG TGCGGGCGGC TTGACGATCT TGCCTTCCTT 
CGCGCCCGCC ATGTCTGCGG CGACAATCGC CGGACGCGGG AGGCTGCCCG CGCGCTGGCC 
TCGGGCGATC TGGTCGCGAT GGGGGCGCTC ATGCGCGAAA GCCATGTCTC GCAGGGTCGG 
GACTTCGGCA TCACCGTGCC CCATACCGAC GTGCTGGCAG CGCTGATGAA CGAAGCGATC 
GGCGAAGACG GCGGCGCTCG GCAGACGGGC GGCGGCTTTG GCGGCGCCGT CGTCGGCCTC 
ATGCGACAGG ACCGCGTCGC GGCTGTGCGC GAAGCGGTCC TTGCCGTGTA TCGGACGCCT 
GCCGGAGACG TGCCTGAAAT CTGTATAGAG GTTCCTTCGG ATGGGGCGGG ACCGGTCGGC 
TGA

Protein sequence

MTALHDRLLA GFAQAFGGEP ELVVRAPGRV NLIGEHTDYN DGFAMPVAIG QETRVAFRPG 
GTGLRVAALD FAEDDAFDSA APQRAGGGWR DYVRGVVDEL VRAGISVPPG QLAIAGSIAK 
GTGLSSSASL EVAVARVLLD AAGERMDPVS LALLAQRAEC DFVGVRCGNL DQIASAATTR 
GHALLIDCRT LALRQIAMPA DVAVMIVQSG VVRGLVDGEY NQRRQECERA ARTLGVPALR 
DVDEGMLDEA CGRLDDLAFL RARHVCGDNR RTREAARALA SGDLVAMGAL MRESHVSQGR 
DFGITVPHTD VLAALMNEAI GEDGGARQTG GGFGGAVVGL MRQDRVAAVR EAVLAVYRTP 
AGDVPEICIE VPSDGAGPVG