Gene Acid345_1701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1701
Symbol
ID	4070484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2065318
End bp	2066514
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	58%
IMG OID	637983709
Product	galactokinase
Protein accession	YP_590776
Protein GI	94968728
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.33248
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCCC CCAGCAACGA GAGCACGTCT GAGATGGTGC AATCCCTGAT CGCGCGATTC 
AAGGAGCACT ACGGCGAGAC TCCGCGGATT TTCCGCGCTC CCGGTCGGGT CAATCTCATT 
GGCGAACATA CTGACTACAA CGAGGGCTTG GTTATGCCTG CCGCCATCGA CTTCTATACC 
TGGGTCGCGG CCTCGCCCCG CAACGATCGT CTTCTGCGCG TCTGGTCTCA GCAATACAAC 
GAGCAATTTG AAATTTACCT CGATGAAGTA CAAGGGCCGC CACGGAAACA TTGGAGCGAT 
TACGTCCGCG GCATGGCCGG AGTTTTGGAA TCCGCGGGCT ACACGCTTAA TGGTGCGAAC 
CTTCTAATCG ACGGTCACGT GCCAGTCGGA GCCGGACTCA GCTCCTCCGC TGCACTGGAA 
CTCTCGACCG GTCTCGCCCT TTCCGGTGTG TCTGGAATTG AGATCGCTCG TCTCGACCTC 
GTCATGCTTT CGCAGAAAGC CGAAAACAAC TACGCGGGTG CGATGTGCGG CATCATGGAC 
CAGTTCATTG CCGGCTTTGG TCATGCCGGA AATGCCATTC TTCTCGACTG CCGCTCGCTC 
GAATACTCGC TGCTGCCGAT CGCGTCAGAT GTACGGCTCG TGATCTGCAA TTCCATGGTG 
AAGCATGACC TCGCCGCCGG TGAATACAAC CATCGCCGCG CCGAGTGCGC CGAAGCCGTG 
AAGCTTCTGC GGAGGTCATA TCCACAAGTC ACCGCATTGC GAGACGTCAC GACGGAAATG 
CTGGAATCAC ATCGTTCCGA CCTTTCAGAC CTTATCTACC GGCGCGCGCG GCACGTCGTC 
ACGGAAAATG ACCGTACTGC CAACGCCGCC AAGGCGCTCC GATCGAATCA TCTCGACGAG 
TTAGGCCGCC TTATGTTTGC TTCGCACGCC AGCCTCCGTG ACGACTACGA AGTAAGTTGC 
CGCGAACTCG ACCTGCTCGT CGAATTCGCG TCCAAGGTCG AAGGTCTCAT CGGTGCGCGT 
ATGACGGGCG GCGGTTTCGG CGGTTGCACC ATCAACCTGG TACGTGCGGA CGCTGTAAAT 
GCGTTCCGTG CCGAGATCAT TGCAAAATAT AAGCAGGCGA CCGGCCGCAG AGCCGACGTG 
TTTATTTCGT CTGCCGCTGA AGGAGCGCAA CAAGTGAAAG TCGAGGCCGA GCAGTGA

Protein sequence

MTAPSNESTS EMVQSLIARF KEHYGETPRI FRAPGRVNLI GEHTDYNEGL VMPAAIDFYT 
WVAASPRNDR LLRVWSQQYN EQFEIYLDEV QGPPRKHWSD YVRGMAGVLE SAGYTLNGAN 
LLIDGHVPVG AGLSSSAALE LSTGLALSGV SGIEIARLDL VMLSQKAENN YAGAMCGIMD 
QFIAGFGHAG NAILLDCRSL EYSLLPIASD VRLVICNSMV KHDLAAGEYN HRRAECAEAV 
KLLRRSYPQV TALRDVTTEM LESHRSDLSD LIYRRARHVV TENDRTANAA KALRSNHLDE 
LGRLMFASHA SLRDDYEVSC RELDLLVEFA SKVEGLIGAR MTGGGFGGCT INLVRADAVN 
AFRAEIIAKY KQATGRRADV FISSAAEGAQ QVKVEAEQ