Gene Cagg_3602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3602
Symbol
ID	7269746
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4377807
End bp	4379060
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	62%
IMG OID	643568410
Product	3-isopropylmalate dehydratase large subunit
Protein accession	YP_002464876
Protein GI	219850443
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.187655
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAACGA TGAGCGAGCA AATCTTAAGC CGTGTTGCCG GACGAATGGT GCGCGCCGGC 
GATGTTGTGA CGGCAAATGT TGATCTGGTG ATGGTACACG ATAGCCTGGC GCCCGGTATT 
ATCCGTATTC TCCACAACGA ACTGGGTGCC GAACGGGTGT GGGATCCTCA GCGCATTGCG 
GTTGTGATCG ATCACGTCGC CCCGGCTGCC AGTGTACAGA CCGCAGAAAA GCAGCAAGAA 
GTGCGGCGTT GGGTCAAGGC GCAAGGTATT CCCAACTTGT TCGATGTCGG GCGCGGTATT 
TCGCACCCGG TGTTGGTGGA AGAGGGGTTG GCCCAGCCGG GTATGTTGAT TTTGGGTAGC 
GATAGCCACA GTACGGCGTA TGGCTGTGTC GGAGCGTTTG GCACCGGCAT GGGCAGCACC 
GACATCGCAC TCGCATTGGC TACGGGTAAG ACGTGGTTGC GCGTGCCGGA GACCACCGTG 
GTGCGAGCAC GCGGTGAGTT TGGGTTTGGT GTGGGGCCGA AAGATTTGGC ACTCCGCGCT 
GCCCGTCTGC TTCGCGCCGA TGGAGCAACA TATGCAGCCA TCGAGTGGCA CGGCGTCGAG 
CACCTGAGCG TGATGGAGCG GATGACGCTG GCGACCCTCT CGATTGAAAT GGGGGCCAAG 
GCTGGGATTA TTCCGCCGAC CGGCCTCGAT CTCACCGGCC CACTCGTACC GACCGTCGAT 
GCCGACGCGC AGTATCAACA GGTGGTTGAG ATCGATCTTG AGCAACTGGA GCCACAAGTC 
TCGGCACCAC ACTATGTTGA CAACGTTGCG AACCTCAGTG ATCTGGGGCG CGTCGCAGTT 
GATGTGGTCT ATCTCGGCAC ATGCACGAAC GGCCATTACG AAGATATGGC AGTGGCAGCC 
CAGATTCTGG CCGGACGACG TATCGCTCCC GGTGTGCGGA TGATCGTTGT GCCGGCTAGC 
GCGCAGGCGC TGCATCGCGC CGCCGCCGAT GGCACCCTCG CAACCTTGCT CGCCGCCGGC 
GCGACCATCG GCACGCCGGG GTGCGGCGCC TGCATTGGCC GCCACATGGG AGTGCTCGCC 
CCCGGTGAGG TCTGTCTGTT CACCGGTAAT CGCAATTTCC GTGGCCGTAT GGGCAGCCCT 
GAAGCGCAGA TCTATTTGGC TTCGCCGGCA GTGGCTGCCG CGACGGCCCT CACCGGTTAT 
CTGACCGACC CGCGGATGGT GATGGATGGG CAGCCGGTTG GCTCACATTC GTGA

Protein sequence

MPTMSEQILS RVAGRMVRAG DVVTANVDLV MVHDSLAPGI IRILHNELGA ERVWDPQRIA 
VVIDHVAPAA SVQTAEKQQE VRRWVKAQGI PNLFDVGRGI SHPVLVEEGL AQPGMLILGS 
DSHSTAYGCV GAFGTGMGST DIALALATGK TWLRVPETTV VRARGEFGFG VGPKDLALRA 
ARLLRADGAT YAAIEWHGVE HLSVMERMTL ATLSIEMGAK AGIIPPTGLD LTGPLVPTVD 
ADAQYQQVVE IDLEQLEPQV SAPHYVDNVA NLSDLGRVAV DVVYLGTCTN GHYEDMAVAA 
QILAGRRIAP GVRMIVVPAS AQALHRAAAD GTLATLLAAG ATIGTPGCGA CIGRHMGVLA 
PGEVCLFTGN RNFRGRMGSP EAQIYLASPA VAAATALTGY LTDPRMVMDG QPVGSHS