Gene Cpha266_0849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0849
Symbol
ID	4570443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	971513
End bp	973084
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	52%
IMG OID	639765447
Product	2-isopropylmalate synthase
Protein accession	YP_911324
Protein GI	119356680
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00973] 2-isopropylmalate synthase, bacterial type

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.118383
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGAGAAA AAATCCTTGT ATTTGACACA ACACTTCGCG ACGGTGAACA GTCACCCGGA 
GCATCCCTGA ATGTCCAGGA AAAAGTAGAG ATCGCCAGGC AGCTTGAAAA GCTTGGCGTC 
GATATCATTG AAGCCGGATT TCCGGCTTCA TCACCGTTAC AGTTTGAGGC CGTTCAAAAA 
ATAGGCGCGG AATCCGGTGC CGTTGTCGCG GCACTGGCAA GGGCCGTTGA ACAGGACATA 
ACCCGCGCAT GGCAATCACT CAGGGAGGCA AGGAAACCAA GAATCCACAC CTTCATCAGC 
ACGTCCGACA TTCATATCAC GGGAAAGTTC GGAAGCAGCC GCTACGGAAC AAGCCTGAAG 
GAAAAACGGG CCACAATCCT GAACATGGCG GTAAACGCCG TTACTTTTGC CCGTTCGCTT 
GCCGGAGATA TTGAGTTTTC AGCCGAAGAT GCGGGAAGAA CAGACCCCGT TTATCTTGCT 
GAAATAATAG AAGCCGTTAT AGAGGCGGGA GCCTCGACCG TCAATATACC CGACACCACA 
GGATATACAT GGCCTTCGGA GTTCGGCAAA AAAATCAGGG ATCTCAAAAC GCGGGTCGGG 
AACATCGAAA AAGCAATCAT CAGCGTTCAC TGCCACAACG ATCTTGGCCT TGCCGTAGCC 
AACTCGCTCA GCGCGCTTGA ACAGGGAGCG CGACAGGTTG AATGTTCGAT CAACGGCATT 
GGAGAACGGG CGGGAAACGC ATCACTTGAG GAGATCGTGA TGGCCCTGAA AGTCCGCAGC 
GACCTGCACA ACTTCGAAAC CGGAATTATT ACCGAAGAGA TTTATAACAC CAGCAGGATG 
GTCTCCTCGT TTACAGGAAT TATCATACAA CCCAACAAAG CAATCGTAGG CGATAACGCG 
TTCTCGCACG AATCGGGCAT TCACCAGGAT GGCATGCTGA AAAACCGGGA GACTTATGAG 
GTCATGACGC CACAATCCGT CGGTGTTCCC GAAACAAGCA TCGTCCTCGG ACGTCATTCC 
GGCAAACACG GTCTCGCGTC CCGTCTGCTC TCGCTCGGCT ATATTCTTCA GGACAAGGAA 
CTTGAAACGA TCTATCGACG TTTTGTTGAC ATTGCCGACA AGAAAAAAGA GGTCTACGAT 
GATGACCTGC GCGTCATGAT GGGAGACGAG CTTTCCAGGC CCGCGAGCGT TTACGAACTC 
GACTACCTCC ACATCAACAG CGGCACTGCT TCAATCCCGA CGGCAACGGT GCGAATCACG 
CACAATCAAC GGACGTTTGA GGAGTCAGCG ACAGGCGATG GACCGGTCGA TGCCTGTTTC 
AGGGCTATCG AAAGAGCGCT CGGCATCGAG TCGATGGTCA GTTCCTATTC GGTAAGATCC 
ACGACGGCAG GACGGCAGGC ACTTGGTGAA GCACTGGTAC GAATCAGGGA CAGGAATGTC 
TCCTTTAACG GAAGAGGCAT TTCAACCGAT ATTATCGAGG CAAGCGCAAA AGCTTACCTC 
CAGGCACTCA GCCTGAGCCG GACATATTTT GAAACAGACA ACACTACAGA AACCATAGAT 
AACGGGGTTT AA

Protein sequence

MREKILVFDT TLRDGEQSPG ASLNVQEKVE IARQLEKLGV DIIEAGFPAS SPLQFEAVQK 
IGAESGAVVA ALARAVEQDI TRAWQSLREA RKPRIHTFIS TSDIHITGKF GSSRYGTSLK 
EKRATILNMA VNAVTFARSL AGDIEFSAED AGRTDPVYLA EIIEAVIEAG ASTVNIPDTT 
GYTWPSEFGK KIRDLKTRVG NIEKAIISVH CHNDLGLAVA NSLSALEQGA RQVECSINGI 
GERAGNASLE EIVMALKVRS DLHNFETGII TEEIYNTSRM VSSFTGIIIQ PNKAIVGDNA 
FSHESGIHQD GMLKNRETYE VMTPQSVGVP ETSIVLGRHS GKHGLASRLL SLGYILQDKE 
LETIYRRFVD IADKKKEVYD DDLRVMMGDE LSRPASVYEL DYLHINSGTA SIPTATVRIT 
HNQRTFEESA TGDGPVDACF RAIERALGIE SMVSSYSVRS TTAGRQALGE ALVRIRDRNV 
SFNGRGISTD IIEASAKAYL QALSLSRTYF ETDNTTETID NGV