Gene Acid345_3109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3109
Symbol
ID	4070223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3693752
End bp	3695473
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	63%
IMG OID	637985128
Product	dihydroxy-acid dehydratase
Protein accession	YP_592184
Protein GI	94970136
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAA AATCCCCAAA GCCACACAAG CGTAGCGACG CCATTACCGA AGGTCCCAAC 
CGCGCCCCAG CCCGCGCCAT GCTGCGCGCC GCCGGGTTCA CCCCGGAAGA CCTTCGTAAG 
CCCATCATCG GCATCGCCAA CACCTGGATC GAAATCGGTC CCTGCAACCT GCACCTTCGT 
GAGCTCGCCG AGCACATCAA GCAGGGCGTT CGCGAAGCCG GCGGTACGCC AATGGAGTTC 
AACACCGTCT CCATTTCTGA CGGCATCACC ATGGGCTCGG AAGGCATGAA GGCGTCGCTG 
GTCAGCCGCG AGGTCATCGC CGACTCCATC GAACTCGTCG CGCGCGGCAA TCTTTTCGAC 
GGCCTGATCG CCCTATCGGG ATGCGATAAA ACCATCCCCG GGACCATCAT GGCGCTCGAG 
CGCCTCGACA TCCCGGGTCT CATGCTCTAT GGCGGCTCCA TCGCGCCCGG CAAATTCCAT 
GCTCAGAAGG TCACGATTCA AGACGTCTTC GAGGCAGTCG GTACGCATGC GCGCGGCAAA 
ATGAGCGACG CTGATCTCGA AGAACTCGAA CACAACGCCT GTCCCGGCGC CGGCGCCTGC 
GGTGGACAAT TCACCGCTAA CACCATGTCC ATGTGCGGCG AATTCCTCGG CATCTCGCCG 
ATGGGCGCTA ACAGCGTCCC GGCGATGACC GTAGAGAAGC AGCAGGTCGC ACGACGCTGC 
GGACACCTCG TCATGGAACT GGTCCGCCGC GACATCCGCC CCAGCCAAAT CATCACGCGC 
AAGGCGATCG AAAACGCAAT CGCCAGCGTC GCCGCCTCCG GCGGGTCGAC CAACGCCGTT 
CTTCACTTGC TCGCCATCGC GCACGAAATG GACGTCGAAC TGAACATCGA AGACTTCGAC 
AAGATCAGTT CGCGCACGCC ACTGCTCTGC GAACTCAAGC CCGCTGGCCG CTTCACCGCC 
ACCGATCTTC ATGATGCCGG CGGTATTCCG CTCGTCGCGC AACGCCTGCT CGAAGCGAAC 
CTGCTGCACG CCGACGCACT GACTGTCACC GGTAAGACCA TCGCCGAAGA AGCGAAGCAG 
GCGAAAGAAA CGCCGGGCCA GGAAGTGGTT CGTCCGCTTA CCGATCCCAT CAAAGCTACC 
GGCGGCCTCA TGATCCTGAA AGGCAACCTC GCATCCGAAG GCTGCGTGGT CAAACTCGTC 
GGACACAAGA AGCTCTTCTT TGAAGGCCCC GCTCGCGTCT TCGAGTCGGA AGAAGAAGCC 
TTTGCGGGCG TGGAAGACCG CACCATCCAG GCGGGCGAAG TGGTCGTGGT CCGATATGAA 
GGCCCGAAGG GCGGCCCTGG CATGCGCGAA ATGCTTGGCG TGACGGCGGC CATCGCCGGC 
ACCGAACTCG CCGAGACCGT CGCGCTCATC ACCGACGGAC GTTTCTCCGG CGCTACCCGC 
GGCTTGAGCG TGGGCCACGT TGCGCCCGAA GCCGCGAATG GCGGCGCGAT CGCTGTGGTA 
CGCAATGGCG ACATCATCAC TCTCGACGTG GAACGCCGCG AACTGCGCGT CCACCTCACC 
GACGCAGAAC TCGAAGCGCG CCTCCGCAAC TGGCGCGCGC CGGAGCCACG ATACAAGCGC 
GGCGTCTTCG CCAAGTATGC GAGCACCGTT TCGTCGGCGT CGTTCGGGGC CGTTACCGGC 
TCCACCATCG AAAACAAGAC CTTAGCCGGG AGTACGAAGT AG

Protein sequence

MTEKSPKPHK RSDAITEGPN RAPARAMLRA AGFTPEDLRK PIIGIANTWI EIGPCNLHLR 
ELAEHIKQGV REAGGTPMEF NTVSISDGIT MGSEGMKASL VSREVIADSI ELVARGNLFD 
GLIALSGCDK TIPGTIMALE RLDIPGLMLY GGSIAPGKFH AQKVTIQDVF EAVGTHARGK 
MSDADLEELE HNACPGAGAC GGQFTANTMS MCGEFLGISP MGANSVPAMT VEKQQVARRC 
GHLVMELVRR DIRPSQIITR KAIENAIASV AASGGSTNAV LHLLAIAHEM DVELNIEDFD 
KISSRTPLLC ELKPAGRFTA TDLHDAGGIP LVAQRLLEAN LLHADALTVT GKTIAEEAKQ 
AKETPGQEVV RPLTDPIKAT GGLMILKGNL ASEGCVVKLV GHKKLFFEGP ARVFESEEEA 
FAGVEDRTIQ AGEVVVVRYE GPKGGPGMRE MLGVTAAIAG TELAETVALI TDGRFSGATR 
GLSVGHVAPE AANGGAIAVV RNGDIITLDV ERRELRVHLT DAELEARLRN WRAPEPRYKR 
GVFAKYASTV SSASFGAVTG STIENKTLAG STK