Gene Acid345_0282 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0282
Symbol
ID	4068826
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	294926
End bp	295933
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	64%
IMG OID	637982283
Product	glucokinase
Protein accession	YP_589361
Protein GI	94967313
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGCCA GGGGAGAGGC GTTCCTGGGA GTCGACATCG GCGGCACGAA GGTCGCCGCC 
GGACTGGTGA ACGATAACGG CGAGCTTCTC TACAAGACTC GCAATCCGAT GAATTGCTCG 
CGTGGAGCGG ACGAAGCCGT CAATGCGGTG CGGGAGGCGA TTGACCGGAC TATCCGCGAA 
AATCCCGAAG CTGAAGTGCG CGCGATTGGA TTGAGTTCAC CTGGCTCGGT GGACCCGCGC 
ACCGGCACCG TGGTAATGGC GACCAACCTT CCCTGCTGGA AAAATTTTGG GCTCGCCGAG 
ATTATCGCGA AACAGTACGG ACTTCCGACC GAACTGCACA ACGATGCCAA CGCCGCCGGA 
CTTGCGGAAG CGGTTTGGGG CAACGGCGTG GGGTACGACT CCGTCTTTTA CGCGACGGTG 
GGGACCGGAA TCGGCACGGC GATCTTGTTC GATCGCCAGG TTTATCTCGG ACGCACCGGC 
TCGGCAGGCG AAGGCGGCCA CATGAGCATC AACTTCGATC ATCGCGGCCC ACGCTGCGCA 
TGCGGCAAGC CCGGATGCAT CGAGTACCTC GCGGCGGGGC CGGGGATCGC GACCCGCGCG 
CGGCGGAGAA TCGAGTCGGC CTCGGGCAAT GAAGGCGCGA AGCTCATCGA ACTCGCGGGC 
GGGGATGTTT CGAAGATCAC CGGCGAGACC GTGGAAGCCG CGTGGAAAGC GGGCGATCGG 
CTGGCGACCG AAGTGTTCGA AGAGACTGCC GATTACATCG CTATCTGGCT GGGCAACATT 
GTGGACTTCC TCGAACCCGA TGTGATCGTG ATGGGCGGCG GCGTGGGCAA CATGCTCTCG 
CCATGGTATC CGCGGATCCG CGAGTACCTG CGCTCGTGGT CGGTGAATCC GCGCGCGGGC 
GAGATCCCGT TCGTGCAGGC GAAGTACGGG CCGGATTCGG GCATCGTTGG CGCGGCTGCG 
CTGGTGGTGC ATCCGGGGCA GTACATCATG CACGCGCCTA CGCACTGA

Protein sequence

MGARGEAFLG VDIGGTKVAA GLVNDNGELL YKTRNPMNCS RGADEAVNAV REAIDRTIRE 
NPEAEVRAIG LSSPGSVDPR TGTVVMATNL PCWKNFGLAE IIAKQYGLPT ELHNDANAAG 
LAEAVWGNGV GYDSVFYATV GTGIGTAILF DRQVYLGRTG SAGEGGHMSI NFDHRGPRCA 
CGKPGCIEYL AAGPGIATRA RRRIESASGN EGAKLIELAG GDVSKITGET VEAAWKAGDR 
LATEVFEETA DYIAIWLGNI VDFLEPDVIV MGGGVGNMLS PWYPRIREYL RSWSVNPRAG 
EIPFVQAKYG PDSGIVGAAA LVVHPGQYIM HAPTH