Gene Clim_2184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2184
Symbol
ID	6355978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2422516
End bp	2423502
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	56%
IMG OID	642669775
Product	ROK family protein
Protein accession	YP_001944187
Protein GI	189347658
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.000268105
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCAAT GGGCAATTGG TATTGATCTC GGTGGTACGG CTGTCAAAGC GGCAATCGTG 
AGCCGTAAAA AAGGAATTCT CAAAAACAGG ACGGTACCTA CCGATACCGC TTCCGGCCCG 
GAGGGGATTG TATCGCAGCT TGCCGTTATG ATCGCTTCGC TTTACACCGA AGCCTCTGCA 
GAGCTTTCCC GTCAAGACTT TTCAGGTATC GGTTTCGGAG CTCCGGGAGC TGTTGATATT 
GAAGCCGGAA CGCTGAGCTA TCCGCCCAAT CTTCCCGGAT GGACCACCTT TCCCCTGCGC 
AGCGAGCTTG AGCGCGCCCT GCTGGCCAAA CTGCCGAAGT CTGTACCGGT GGTCATCGAG 
AACGACGCCA ATGCTGCGGC TTACGGTGAA GCGGTCTATG GCGCCGGCCG TAATTTTCGG 
GATTTTTTGA TGGTGACACT CGGCACCGGA GTAGGCGGCG GCATCGTTCT GAACCGTAAA 
CTGTACCGGG GGCCGAACGG AACGGCCGGT GAAATAGGAT TTATGATTGT CGATTTTCAG 
AGTCCGGCTG TGCATGCCGG TATTCACGGC ACCATAGAAG GGATGATCGG CAAAGAGCGC 
ATTGTCGAAT ATGCATGCGG CCTTATTCGT GACAACCCTG AAGCCGGCTC GTTGCTTGCG 
TCTCTCTGTG GCCAGGATTT TTCATCGCTC TCTCCCCGTC ATATCGAGCA GGCGGCAAAA 
ATGGGCGATC AGCTCTCTCT TGCGGTATGG AACCATGTCG GGGCAATTCT CGGAACGGGG 
TTCGCTTGCG TTACCTCGCT CATGGATATA CGAAAATTCG TTATCGGGGG GGGGATATCG 
GCAGCCGGCA CTCTTATTTT CGAACCGGCT TACCGGCAGT TGCTCCGCTC TACCCTGCCT 
TCGATGCATG ACGGGCTCGA ACTGGTTCCG GCCGAACTCG GCAACAGTGC GGGAATATAT 
GGCGCGGCGG CGTTGTGTTT CAGTTGA

Protein sequence

MSQWAIGIDL GGTAVKAAIV SRKKGILKNR TVPTDTASGP EGIVSQLAVM IASLYTEASA 
ELSRQDFSGI GFGAPGAVDI EAGTLSYPPN LPGWTTFPLR SELERALLAK LPKSVPVVIE 
NDANAAAYGE AVYGAGRNFR DFLMVTLGTG VGGGIVLNRK LYRGPNGTAG EIGFMIVDFQ 
SPAVHAGIHG TIEGMIGKER IVEYACGLIR DNPEAGSLLA SLCGQDFSSL SPRHIEQAAK 
MGDQLSLAVW NHVGAILGTG FACVTSLMDI RKFVIGGGIS AAGTLIFEPA YRQLLRSTLP 
SMHDGLELVP AELGNSAGIY GAAALCFS