Gene Acid345_3865 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3865
Symbol
ID	4071017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4576617
End bp	4577660
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	63%
IMG OID	637985889
Product	glucokinase
Protein accession	YP_592939
Protein GI	94970891
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTACG CAATCGGTGT GGACCTCGGC GGTACCAATC TGCGAATCGC AGCCGTCGAA 
GAACGCGGCA CCCTCCTCGA AAAAGTCACG CTTGGCACGC AGGTACAGCG CGGCCGCGAA 
TATGTTGTCG GTCAAATGAC CGATGCCATC CGCCACGTCA CTACCAAGTA CCAGGACCAC 
GGCAAGCTGA TTGGCATCGG CATCGGTGTC CCGGGCTTCA TTGATATGGA TACCGGCACC 
GTGCGGGAAT CGCCGAACCT ACCCGGCTGG TCGAACTATC CCGTGCATAA GGACATCGAG 
AGCCGGCTCG GAACCAAGGT CATTCTTGAG AACGACGCCA ACGCCGCCGC GATGGGCGAG 
AAGTGGCTCG GCGCCGGCCG CGACACCGAC GACATGGTGA TGTACACGCT CGGCACCGGC 
GTAGGTGGTG GAATTATCAT GGCCGGCCGC TTGTGGCACG GGATGAACGG CATGGCCGGG 
GAGCTTGGCC ACCATACCGT TTTGCCCGAC GGCCATATCT GCGGCTGCGG CAACCACGGC 
TGCCTCGAAC AATATGCCTC GGCGACGGCC GTCGTGCGCA TGGCGCGCGA AGCTGTCGCC 
AACGGCCTGT CCGACGCGCT CGCCAATGCC TCACGCAACG ACGTAGAGTT CAGTTCGAAG 
GTGATTTACC AGCTCGCCAT CCAGGGTGAC AAGGCCGCGC AGGAGATTTT CAACACCGTC 
GGCCACTCGA TCGGCATCGC CGTGGCCAAC ATGGTCAACG CGCTGAATTT CCCGATGTAC 
GTGATCGGCG GCGGCGTTGC CAGCGCCTGG GACGCCTTCC ACAATCCGAT GATGGAAGAA 
GTACGCAAGA GATCGTTCAT CTATCGCGTC ACCGCGCCGG AAGCGGTCGC TGCCGGCCAG 
AAACGCACCA TCGTGACCCG CGCTTTGCTC GGCGGCGATG CCGGTCTGTT CGGCGCCGCC 
CGCCTGCCGA TGGTCGTCAA CGGCGAGTCG TCCGCACCCG CCGCGCAATC CAAGGCTGAT 
ACACCGGTAG CCGGCACTCG CTAA

Protein sequence

MSYAIGVDLG GTNLRIAAVE ERGTLLEKVT LGTQVQRGRE YVVGQMTDAI RHVTTKYQDH 
GKLIGIGIGV PGFIDMDTGT VRESPNLPGW SNYPVHKDIE SRLGTKVILE NDANAAAMGE 
KWLGAGRDTD DMVMYTLGTG VGGGIIMAGR LWHGMNGMAG ELGHHTVLPD GHICGCGNHG 
CLEQYASATA VVRMAREAVA NGLSDALANA SRNDVEFSSK VIYQLAIQGD KAAQEIFNTV 
GHSIGIAVAN MVNALNFPMY VIGGGVASAW DAFHNPMMEE VRKRSFIYRV TAPEAVAAGQ 
KRTIVTRALL GGDAGLFGAA RLPMVVNGES SAPAAQSKAD TPVAGTR