Gene Clim_1588 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1588
Symbol
ID	6354236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1709836
End bp	1710846
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	53%
IMG OID	642669190
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001943612
Protein GI	189347083
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGTTC TGGTTACCGG CGCAGCCGGT TTTATCGGTT CACATGTCTG TCAACGGCTT 
CTTGAAAGAG GAGAGCGTGT GACAGGGCTT GATAACCTGA ATGATTATTA TGATGTGAGC 
CTGAAGGAGG CCCGTCTTGA CTGGCTCAGG CCATATGCTG ATTTCCGGTT TGTTAAAACC 
GATCTTGCCG ACCGGCAGGG CATGGAAGAG CTTTTTCGCA AAGGCGGATT TGAAAAAGTG 
GTTAATCTTG CCGCTCAGGC CGGGGTTCGT TATTCCATTG TCAATCCGCA CTCCTATGTC 
GAAAGCAATA TTCTGGGATT TCTGAATATT CTCGAAGGGT GTCGTCATAA CGGCGTGGAG 
CATCTCGTTT ATGCATCGTC AAGTTCGGTC TACGGCGCGA ACGAAACTAT GCCGTTTTCG 
GTGCACGACA ATGTCGATCA CCCGCTCTCT CTATACGCAG CCAGCAAGAA AGCCAACGAA 
CTGATGGCGC ATACATACAG CCATCTCTAC AACATTTCCG CAACAGGACT GCGCTTCTTT 
ACCGTATATG GCCCGTGGGG ACGTCCCGAT ATGGCGCTCT TTCTCTTTAC CGATGCCATT 
CTGAACAACC GCCCGATCAA GGTGTTCAAC TATGGCAAAC ACCGGCGAGA TTTCACCTAC 
ATCGACGACA TCGTCGAGGG GGTGATCCGG ACGCTCGATC ACAATGCCGA AAGCAATCCT 
GAGTGGTCCG GGCTGCACCC TGATCCCGGA TCGAGCCGTG CGCCGTGGAA GGTGTACAAC 
ATCGGCAACA GCCAGCCGGT CAACCTGATG GACTACATCG GGGCGCTCGA ACGGCAGCTC 
GGCAAAACAG CGGAAAAGGA GTTTCTGCCC ATGCAGCCGG GTGACGTGCC CGACACCTAT 
GCCGATGTCG AGCAGCTCAT ACAGGATGTG CATTATAAAC CGGAAACTAC CGTGGAGGAA 
GGTGTCAGAC GGTTTGTTGC CTGGTATCGG GATTATTATG ATGTCAGGTA G

Protein sequence

MNVLVTGAAG FIGSHVCQRL LERGERVTGL DNLNDYYDVS LKEARLDWLR PYADFRFVKT 
DLADRQGMEE LFRKGGFEKV VNLAAQAGVR YSIVNPHSYV ESNILGFLNI LEGCRHNGVE 
HLVYASSSSV YGANETMPFS VHDNVDHPLS LYAASKKANE LMAHTYSHLY NISATGLRFF 
TVYGPWGRPD MALFLFTDAI LNNRPIKVFN YGKHRRDFTY IDDIVEGVIR TLDHNAESNP 
EWSGLHPDPG SSRAPWKVYN IGNSQPVNLM DYIGALERQL GKTAEKEFLP MQPGDVPDTY 
ADVEQLIQDV HYKPETTVEE GVRRFVAWYR DYYDVR