Gene Plav_1934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_1934
Symbol
ID	5453658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	2106318
End bp	2107367
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	64%
IMG OID	640877511
Product	galactokinase
Protein accession	YP_001413206
Protein GI	154252382
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.210895
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGAAA TCTTCAAGGA GATATTCAAT CGCGATGCGG CGGCGGAAGC CTCCGCGCCC 
GGCCGCGTCA ATCTCATCGG CGATCATACG GATTATGCAG GCGGCTTTTG CCTGCCGATG 
CCGCTCGCGC TCGAGACACG AGTGGCGATG GCACCTGCGC CGGCGTTTCG CGCCCACAGC 
CTCGATCTGG ACGAGACGGC GCCGTTCGAT CCTGCCGCGC CCGCGCGTGG CGACTGGACG 
GACTATATCG CGGGGCCGCT TGCGGTACTC CGGCAGGCGG GATTTGCCGT TCCGCCGGTC 
GAGGTGCTGG TGAGTTCCGA TGTCCCGCAA GGGGCGGGCG TTTCTTCGTC GGCTGCGTTA 
GAGGTTGCCA CCTTGCGCGC GGCGCTGGAT TTGTCAGGTG CCAAGCTGCC GGACATGGAA 
GTGGCGCGGC TCGCGCAGTC GGCGGAAAAC GTCTATTGCG GCGTTCAATG CGGCATCCTC 
GATCAGATGG CGAGTGCCGT GGGCCGTCCC GGTCAGGCGT TGCTCCTCGA TTGCCGGAGC 
AACGGCACGC GCCTTGTGCC AGTGCCGCCT GAATTCCATT TCGCCATTGT CCATTGCGGC 
GAGGCACGCC GGCTCGTCGA TGGCGAATAT AATGAACGCC GCCGCTCGGT GGAAGAAGCG 
GCGCGGCTCC TTGGCATGGT TTCACTGCGC GATGCGGGTC CGGACGATCT TGCCGGGATC 
TCCGATGTGC GACTTCTCAA GCGCGCCCGT CATGTTGTCA GCGAGAATAC GAGGGTAACT 
GCTGCCGTGG CGGCGCTTGA GCGGCGCGAC CTGCGCGGCT TCGGCATGTT GATGGTGGAG 
AGCCATCGCT CGCTCGCGGA AAATTTCGAG GTTTCTACGC CGGTGCTTGA CCGTCTTGTC 
GATGATGCGC TCGAAGCCGG TGCTTATGGC GCGCGGCTCA CCGGCGCGGG TTTTGGCGGA 
TGTATTGTCG CGCTGTTGCC GGCGGGCAGG GAAGTCTGGT GGAAGAAAGT ATCGGCCGCT 
CATCCGAAGG CGTGGCTCGT GCAGGCGTGA

Protein sequence

MREIFKEIFN RDAAAEASAP GRVNLIGDHT DYAGGFCLPM PLALETRVAM APAPAFRAHS 
LDLDETAPFD PAAPARGDWT DYIAGPLAVL RQAGFAVPPV EVLVSSDVPQ GAGVSSSAAL 
EVATLRAALD LSGAKLPDME VARLAQSAEN VYCGVQCGIL DQMASAVGRP GQALLLDCRS 
NGTRLVPVPP EFHFAIVHCG EARRLVDGEY NERRRSVEEA ARLLGMVSLR DAGPDDLAGI 
SDVRLLKRAR HVVSENTRVT AAVAALERRD LRGFGMLMVE SHRSLAENFE VSTPVLDRLV 
DDALEAGAYG ARLTGAGFGG CIVALLPAGR EVWWKKVSAA HPKAWLVQA