Gene Cpha266_0850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0850
Symbol
ID	4570444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	973107
End bp	974165
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	52%
IMG OID	639765448
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_911325
Protein GI	119356681
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.898844
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATAAGA TTGTTTCAAT ACCGGGTGAC GGTATCGGCC CGGAAGTCGT TGCTGGCGCC 
GTTACCGTGC TCAGAAAAAT CTCTGAAAAG CACGGTTTCG AAATCCGCAT TGAGGAACAC 
CCTTTTGGAG GCGCATCCTA CGACCTGCAC GGAACCATGC TTACCGATCA AACGCTTGAA 
GCGTGCAAAA ACTGCGATGC CGTTCTGCTT GGAGCCGTAG GAGGACCGAA ATGGGAGAAT 
CTCCCGCATG AGCACAAACC CGAAGCAGCT TTGCTCAAAC TCAGAAAGTC GCTCGGTCTC 
TTCGCTAACC TGAGGCCGGC AAAAGTCTAT GATCCCCTTG TTGACGCTTC GTCTCTCAAG 
GCAGAAGTCG TGCGGGGAAC AGATTTTCTT GTCTTCAGGG AGCTGATCGG CGGCATCTAT 
TTCGGAGAGC CGAGAGGATA TGACGAAAAC AGAGGGTGGA ACACCATGGT CTATGAACGC 
CATGAAGTTG AGCGCATAGC CCGCCTTGCC TTTGAAGCTG CCCAGAAGCG TGGCGGACGG 
GTTATCTCCA TAGACAAAGC CAATGTGCTT GAAGTTTCCC AGTTCTGGAG AAATGTCGTA 
CATGAGGTAC ACCGGGAGTT TCCCGACATA GAACTCAGCG ACATGTATGT TGACAACGCT 
GCCATGCAGA TTGTCAGAAA CCCCTTGCAA TTTGACGTTA TCGTCACAGG AAACCTTTTT 
GGTGACATAC TCAGCGACAT TGCGGGCATG ATCACCGGTA GTCTTGGAAT GCTTCCTTCG 
GCCAGCATCG GAACAAGCCA TGCTCTCTAC GAACCTATTC ACGGCAGTGC GCCGGACATT 
GCAGGAAAAA ACATTGCGAA CCCCATTGCG ACCATCGCAT CGGTAGCCAT GATGTTCGAA 
CACAGCTTCT GCATGCCTGA TATAGCCGAA GAGATCAGCC AGGCTATTGT ATCGGCCCTT 
GCGGCCGGCC TCAGAACCGC AGATATTGCC GGGGCGGGTG ACAGAATTGT TTCAACTACT 
GAAATGACCG AAGCCATCGT CACCAGCCTC GGTTCATAA

Protein sequence

MYKIVSIPGD GIGPEVVAGA VTVLRKISEK HGFEIRIEEH PFGGASYDLH GTMLTDQTLE 
ACKNCDAVLL GAVGGPKWEN LPHEHKPEAA LLKLRKSLGL FANLRPAKVY DPLVDASSLK 
AEVVRGTDFL VFRELIGGIY FGEPRGYDEN RGWNTMVYER HEVERIARLA FEAAQKRGGR 
VISIDKANVL EVSQFWRNVV HEVHREFPDI ELSDMYVDNA AMQIVRNPLQ FDVIVTGNLF 
GDILSDIAGM ITGSLGMLPS ASIGTSHALY EPIHGSAPDI AGKNIANPIA TIASVAMMFE 
HSFCMPDIAE EISQAIVSAL AAGLRTADIA GAGDRIVSTT EMTEAIVTSL GS