Gene Achl_1233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_1233
Symbol
ID	7292679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	1357088
End bp	1358275
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	69%
IMG OID	643589639
Product	galactokinase
Protein accession	YP_002487313
Protein GI	220912004
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.000254056
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGAGCGCCG CACCCCACCC CACCGCCGAT TCAGCAGTCC CAGGCACACA GGACCTGGCT 
GCCCGCTTTA CCCGGGAGTT CGGCGCCGCC CCGGCAGGCG TCTGGCAGGC ACCGGGCAGG 
GTCAACCTGA TCGGTGAGCA CACTGACTAC AACGAGGGCT TCGTGCTGCC CTTCGCCATC 
GACCGGACTG CCCGGGTGGC TGTGGGCATC CGCCAGGACT CCACGGTTCG GCTGCTGTCA 
ACGTACGGGG ACCAGGGCAT GGTTTCCGCC TCGCTCGACG CCCTGGAGCC AGGCTCCGCC 
AAAGGGTGGA CCAAGTATCC CCTCGGCGTG ATGTGGGCAC TCCGCGAGCG CGGCATTGAC 
GTTCCCGGAA TCGACCTGCT GCTGGACTCG GATGTTCCGC TCGGCGCAGG CCTGTCCTCG 
TCACACGCGA TCGAGTGCGC GGTGGTCACC GCCCTCAACG AGCTCACCGG CGCAGGCCTG 
GCAGCGCAGG ACATGGTCCT GGCCACGCAG CGGGCTGAAA ACGACTTCGT GGGGGCTCCC 
ACCGGCATCA TGGACCAGTC CGCATCCCTT CGCGGCGCCA AGGGCCACGC GGTCTTCCTG 
GATTGCCGTG ACCAGAACGC CACCCTGGTG CCGTTCGAAA CGGAACCCGC GGGGCTGGTC 
CTGCTGGTCA TCGACACCAA GGTCTCGCAC TCTCACGCCG ACGGCGGGTA CGCCTCGCGC 
CGCGCATCCT GCGAACTCGG CGCCGAGGTC ATGGGCGTCA AGGCACTGCG CGACGTCCAG 
GTCGGTGACC TGGAGGAAGC CAGCGGGCTG CTGGACGAGG TGACGTTCCG GCGCGTGCGC 
CACGTTGTCA CGGAGAACGA CCGCGTGCTG CAGACGGTCG AGCGCCTGGC CGCCGAGGGG 
CCCGCTGCCA TCGGCACACT GCTGGATGCC AGCCACGCAT CCATGCGGGA CGACTTTGAG 
ATCTCCTGCC CGGAGCTTGA CCTGGCGGTG GACACCGCCC GTGCCAACGG AGCCATCGGA 
GCACGGATGA CCGGAGGCGG TTTCGGGGGT GCGGCGATTG CCCTGACCCC CGTCGCTTCC 
GAAGCGAAGG TGCGCGCCGC CGTCGTCCGT GCCTTCGCCG AGGCAGGCTA TGCCGCACCG 
GACATCTTCA CTGTCTCCCC GGCAGCGGGC GCCATGCGCG TCGCCTAG

Protein sequence

MSAAPHPTAD SAVPGTQDLA ARFTREFGAA PAGVWQAPGR VNLIGEHTDY NEGFVLPFAI 
DRTARVAVGI RQDSTVRLLS TYGDQGMVSA SLDALEPGSA KGWTKYPLGV MWALRERGID 
VPGIDLLLDS DVPLGAGLSS SHAIECAVVT ALNELTGAGL AAQDMVLATQ RAENDFVGAP 
TGIMDQSASL RGAKGHAVFL DCRDQNATLV PFETEPAGLV LLVIDTKVSH SHADGGYASR 
RASCELGAEV MGVKALRDVQ VGDLEEASGL LDEVTFRRVR HVVTENDRVL QTVERLAAEG 
PAAIGTLLDA SHASMRDDFE ISCPELDLAV DTARANGAIG ARMTGGGFGG AAIALTPVAS 
EAKVRAAVVR AFAEAGYAAP DIFTVSPAAG AMRVA