Gene Clim_1204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1204
Symbol
ID	6353721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1298908
End bp	1300479
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	55%
IMG OID	642668820
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_001943250
Protein GI	189346721
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.128075
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTCCAG TAGTGACCGC GGCAGAAATG ATGAGAGCAG ACAGTGCCGC TATAGACGAT 
CTCCAGGTCG GAGCGATACG GCTTATGGAA CTTGCCGGAG CCCGTACATC GGATCTCGTC 
AGGGAACTTA TCGAAAAAGA AAATATCTCC GGCAGCAGTT TTCTTGTAGT CTGCGGCAAG 
GGCAACAATG GCGGCGACGG TCTGGTACTT GCCCGTCATC TGCTGAACCA CGGCGCGGAA 
GTCGATATCC TGCTGCTCTA CCCGGAAACG GATTTATCCC CGATCAACCG CAATACTCTT 
GACACTCTCT GTGGCTACCA AGCCCTGAGC GGACGTCTGC GGATCTTTCA TGGTCACGCT 
GAGGCCCTGC CTTTCGTCAG GGATACACAC TATGAAGTTC TGATCGATGC GATACTCGGT 
ACCGGGCTGA AACTCCGCCG ACAACTCTCA TCACCGCTAT GCGAAGGTAT TGATCTGCTG 
AACGGCATCC ATGACCGTGC CGGGTCGCCA CTCATAGCAC TCGATATTCC TTCAGGTCTC 
GATGCGACAT CCGGCGTTGC CGCCGAAAGG TGCGTTCTTG CCGATATGAC GGTTTCCATG 
GCTTTTCTGA AAACTGGATT TTTTTTCAAT GACGGTCCAC TCCACTGCGG AGAGCTCCGT 
ATCGCCGACA TATCGATCCC GGAATTTCTG ATCGCCCCTT CAGCCTGCCG TTTAACCGAT 
AAAGAGTATG CCGCGGAACA TTTTATTCTG AGAGAGCCTG AGGGTGCAAA GCACCAGAGC 
GGAAAGGTGC TTATTGTCGC CGGATCGCAA TCCGATAACG CTTCTATGCT TGGAGCGGCA 
ATGCTTGCCG TTAAAGCCGC ACTCAAAACC GGTGCCGGAT ATGTGTGTGC GGCCATCCCC 
ATTGCCGCTG CGGGCGTGCT GCATTCCTAT GCGCCGGAAG CAGTCGTCAT TGCCCAGGAG 
ATGGACGCCA TCCTCGAAAA AGCCGGATGG GCAGATGCTG TGCTGATCGG ATGCGGACTT 
GGAAGGGATC CGAAAACTGT AGATTTCATT CGCGAGCTGC TCCGGAAACC CGAAATAACA 
GGCTGTAAAC TCGTGCTTGA CGCCGATGCG CTCTTTGCCC TTTCCGGTGT TGCCCTGCCT 
GCATCCGGAA TCGATTTCGC CAATACCATA CTGACGCCGC ATTACGGAGA ATTCAGCCGG 
CTTTGCGGCC ATACGGCAGA CGAGATTGCT CTGAACGCGC TTGTGCTCGC GACTGATTTT 
GCACGGCTAA ACAGGGTCAA TCTGCTGCTC AAGGGCCATC CAACTCTGAT TGTCGGTGGC 
GAGGAGGGGC TTATGCTTAA CGACTCGGGC ACTGAAGCGC TCTCTACCGC CGGCTCCGGA 
GATATCCTGG CCGGGATGAT TGCAGCGATT GCTGCAAAAG GAGCCGAAAT ACTCGACGCA 
GGAGCGGCGG CGGCCTGGTT TCACGGCAGG GCTGGAGATC TGGCAAATGA CATTTCCAGC 
CTGGTATCGG CAAACGACAT CCTCAATGCC ATACCTGAAG CTGTGCAGGA AATTTTTTCC 
CTGGAGGAGT AA

Protein sequence

MLPVVTAAEM MRADSAAIDD LQVGAIRLME LAGARTSDLV RELIEKENIS GSSFLVVCGK 
GNNGGDGLVL ARHLLNHGAE VDILLLYPET DLSPINRNTL DTLCGYQALS GRLRIFHGHA 
EALPFVRDTH YEVLIDAILG TGLKLRRQLS SPLCEGIDLL NGIHDRAGSP LIALDIPSGL 
DATSGVAAER CVLADMTVSM AFLKTGFFFN DGPLHCGELR IADISIPEFL IAPSACRLTD 
KEYAAEHFIL REPEGAKHQS GKVLIVAGSQ SDNASMLGAA MLAVKAALKT GAGYVCAAIP 
IAAAGVLHSY APEAVVIAQE MDAILEKAGW ADAVLIGCGL GRDPKTVDFI RELLRKPEIT 
GCKLVLDADA LFALSGVALP ASGIDFANTI LTPHYGEFSR LCGHTADEIA LNALVLATDF 
ARLNRVNLLL KGHPTLIVGG EEGLMLNDSG TEALSTAGSG DILAGMIAAI AAKGAEILDA 
GAAAAWFHGR AGDLANDISS LVSANDILNA IPEAVQEIFS LEE