Gene Cag_0199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0199
Symbol
ID	3746686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	227719
End bp	228699
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	49%
IMG OID	637772726
Product	glucokinase, putative
Protein accession	YP_378520
Protein GI	78188182
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCGTT GGGCACTTGG TATAGATTTT GGTGGAACTG CTATTAAAGC GGCTGTTATT 
AGCGAAGGGC AAGGGTTGGT TGAAGATTGC CGTGTGCCAA CGAACAGCTC GGCAGGTCCC 
GAAGCTATTT TTTCGCAGCT TGCTGAGTTA ATAGGCGCAA TGTATCACAA AGGGTGTGCT 
ACATGTGATG CCGCAAATTT TGCAGGTGTT GGCTTAGGGG CACCCGGTGT GGTAGATGTG 
GAGCGTGGTG TTTTAAAATA TCCACCCAAT TTGCATGGAT GGGGCTTGGT GCCATTGCGT 
GAGGAGTTGC AGCAGCGTTT GCAGCAAGAG CATGGTTTGC AGGTGCAGAT TCACTTGGAT 
AATGATGCGA ATGTTGCGGC GTTTGGCGAA TCGCGTTATG GGGCAGGGCA ACCATTCCCT 
AACTTTTTAA TGGTTACGCT TGGCACGGGC GTTGGTGGTG GCATTGTACT TAATCGCTCA 
ATTTATCGAG GCAGTTATGG TACGGCAGGC GAGGTTGGCT TTATGATTGT GGATGTTGAT 
AGCCCCCATA CGCATGCTGG TATTCACGGA ACGCTTGAGG GGATGTTGGG CAAAAAGTCA 
ATTGTAGCAA TGGCTTGTAG CATGATGCAC AACGCGGCAA CCACTTCCAC TATGGGAAAT 
TATTGCAATA ACGACTTTTC ACGCCTTTCG CCTCGCCATA TTGAGTATGC TGCGCGCGAA 
GGTGATGCGG TGGCGCTTGC CGTGTGGGAG CGTGTTGGGC ATTTACTTGG TTCAGCACTT 
GCCAGCGTTA CAGCTTTAAT GGATATTCGT AAATTTGTTA TTGGAGGTGG AATTTCTGGG 
GCTGGTTCCT TGATTTTTGA ACCTGCTCGG CAGCAATTAC TCCACTCAAC GCACCCTTCC 
ATGCACGAAG GGCTGGAGCT TGTACCAGCA TTTCTTGGCA ATAAAGCAGG AATGTATGGA 
GCGGCATCGC TCTGTTTTTA A

Protein sequence

MSRWALGIDF GGTAIKAAVI SEGQGLVEDC RVPTNSSAGP EAIFSQLAEL IGAMYHKGCA 
TCDAANFAGV GLGAPGVVDV ERGVLKYPPN LHGWGLVPLR EELQQRLQQE HGLQVQIHLD 
NDANVAAFGE SRYGAGQPFP NFLMVTLGTG VGGGIVLNRS IYRGSYGTAG EVGFMIVDVD 
SPHTHAGIHG TLEGMLGKKS IVAMACSMMH NAATTSTMGN YCNNDFSRLS PRHIEYAARE 
GDAVALAVWE RVGHLLGSAL ASVTALMDIR KFVIGGGISG AGSLIFEPAR QQLLHSTHPS 
MHEGLELVPA FLGNKAGMYG AASLCF