Gene Clim_0742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0742
Symbol
ID	6356023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	812770
End bp	814467
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	55%
IMG OID	642668367
Product	dihydroxy-acid dehydratase
Protein accession	YP_001942802
Protein GI	189346273
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.853368
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATCTG ATACGGTAAA GACAGGATTT GAAAAAGCTC CGCACCGCAG CCTTCTGAAG 
GCTACCGGAG CTATCGCCTC CAACAATGAT TTCAGAAAGC CCTTCATCGG CATCTGCAAC 
TCATTCAATG AACTTATACC CGGCCACGCC CACCTTCAGG AACTGGGAAG AATCGCAAAA 
GAGGAGGTCC GCAAGGCAGG AGGCGTTCCT TTCGAGTTCA ATACCATCGG CGTTTGCGAC 
GGCATCGCCA TGGGTCATAT CGGCATGCGC TACTCTCTTG CAAGCCGCGA GCTCATTGCC 
GACAGTGTTG AAACCGTTGC CGAGGCACAT CGTCTTGACG GCCTGGTCTG CATACCCAAC 
TGCGACAAGA TCACCCCCGG CATGATGATG GCTGCTCTGC GTATCAACAT ACCTGTTATT 
TTCGTTTCGG GAGGTCCGAT GAAGGCCGGA TGTACCCCAT CGGGAAAAAC CGTTGACCTG 
ATCTCGGTTT TCGAGGCCGT CGGACAGTGC AGTACCGGAG AGATCACGGA ATCCGAGCTT 
GAGACCATCC AGGACAGCGC CTGTCCCGGA TGCGGATCGT GTTCCGGCAT GTTTACCGCC 
AATTCAATGA ACTGCCTCTC GGAGGCTCTC GGCATAGCAC TTCCCGGTAA CGGAACGATT 
CTTGCAATCG ATCCGAGACG TAACGAACTG GTCCGCGAAG CCTCGCGAAA AATTGTCGAT 
CTGGTCAACA ACGACATACG GCCCAGGGAC ATCATAACCA GAAAATCCCT GCTCAACGCC 
TTTGCCCTTG ATTTTGCCAT GGGGGGCAGC ACCAATACGA TCCTGCACAC CCTGGCCATC 
GCCAATGAAG CGGAACTGGA TTTCGACTTC TCGGAACTCA ATGCCCTTTC GGCTAAAACG 
CCGTATATCT GCAAAGTCAG TCCGGCCACC ATGGATGTCC ACATCGAGGA TGTCGATCGT 
GCCGGCGGCA TTTCAGCCAT ACTGAAAGAA CTCAGCCGTG TCGACGGTCT TCTCGACCTC 
TCGGCACCGA CCGTTACCGG AAAAACACTC GGAGAGAATA TTGCCGGCGC GGAAGTGCTT 
GACAGAAACG TCATCAGAAG CATCGAAAAC CCATACTCCG CAACGGGCGG TCTGGCCGTT 
CTTTACGGAA ATCTGGCCCC GCAGGGTGCC GTCATCAAAA CCGGCGCCGT CAGCCCTGAA 
ATGATGACCC ATACCGGACC GGCAAAAGTT TACGACTCGC AGGATGAAGC CATCAAAGGC 
ATCATGGACG GCGATATCTG CGCCGGAGAT GTGGTGGTTA TCCGATATGA GGGACCGAAA 
GGCGGACCGG GAATGCCTGA AATGCTCTCC CCTACCAGTG CCATCATGGG GCGCGGTCTC 
GGCGGTTCTG TCGCTCTCAT TACCGACGGC CGGTTCTCCG GCGGATCGAG GGGAGCATGC 
ATCGGCCACG TCTCGCCGGA AGCTGCCGAA AAAGGACCGA TCGCCGCGCT GGAAAACGGC 
GACATGATCA CCATCGACAT CCCGAACCGC TGTATCAGTG TCGATCTTCC GGAAACAGTC 
ATTGCCGGAC GTATTGCCGC TCTCAAGCCT TTCGAGCCAA AAATCAAAAA AGGCTACCTT 
GCGCGTTACG CACAACTTGT CACCTCGGCA AATACCGGGG CGATCATGAA AAACCCTGCT 
TACTGTGAAT CAAAATAA

Protein sequence

MRSDTVKTGF EKAPHRSLLK ATGAIASNND FRKPFIGICN SFNELIPGHA HLQELGRIAK 
EEVRKAGGVP FEFNTIGVCD GIAMGHIGMR YSLASRELIA DSVETVAEAH RLDGLVCIPN 
CDKITPGMMM AALRINIPVI FVSGGPMKAG CTPSGKTVDL ISVFEAVGQC STGEITESEL 
ETIQDSACPG CGSCSGMFTA NSMNCLSEAL GIALPGNGTI LAIDPRRNEL VREASRKIVD 
LVNNDIRPRD IITRKSLLNA FALDFAMGGS TNTILHTLAI ANEAELDFDF SELNALSAKT 
PYICKVSPAT MDVHIEDVDR AGGISAILKE LSRVDGLLDL SAPTVTGKTL GENIAGAEVL 
DRNVIRSIEN PYSATGGLAV LYGNLAPQGA VIKTGAVSPE MMTHTGPAKV YDSQDEAIKG 
IMDGDICAGD VVVIRYEGPK GGPGMPEMLS PTSAIMGRGL GGSVALITDG RFSGGSRGAC 
IGHVSPEAAE KGPIAALENG DMITIDIPNR CISVDLPETV IAGRIAALKP FEPKIKKGYL 
ARYAQLVTSA NTGAIMKNPA YCESK