Gene Cphy_3348 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3348
Symbol
ID	5741630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4077540
End bp	4079213
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	42%
IMG OID	641294451
Product	dihydroxy-acid dehydratase
Protein accession	YP_001560440
Protein GI	160881472
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0168284
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGTG ATGCAGTAAC CAAAGGGATA CAACAAGCAC CTCATCGATC TTTATTTAAT 
GCGTTGGGAT TAACCAAGGA AGAACTAGAT AAACCACTCA TAGGTATTGT AAGTTCTTAT 
AATGAAATTG TACCAGGACA TATGAACTTA GATAAGATAG TGGAAGCCGT GAAATTAGGA 
GTTGCGATGG CAGGAGGAAC ACCAATCGTA TTTCCAGCGA TTGCAGTATG TGATGGAATT 
GCGATGGGAC ATATCGGTAT GAAATATTCC CTAGTAACGA GGGATTTGAT TGCTGATTCT 
ACTGAAGCAA TGGCAATGGC ACATAGTTTT GATGCTTTAG TAATGGTTCC AAACTGTGAT 
AAGAATGTTC CAGGTTTACT TATGGCAGCA GCTAGAGTAA ATATTCCTAC CATATTTGTA 
AGTGGAGGAC CAATGCTTGC AGGTCGTGTT CACGGAGAAA AGAGAAGCCT TAGCAGTATG 
TTTGAAGCAG TTGGCGCACA TGCAGCTGGT AAGATGACGG AAGAGGAAGT TGAGGAATTT 
GAAAATAAAG TTTGCCCAAC CTGCGGATCT TGCTCCGGAA TGTATACGGC AAACAGTATG 
AACTGTTTAA CAGAGGCGCT AGGAATGGGA CTGAAAGGAA ATGGAACAAT TCCAGCAGTA 
TACTCTGAAC GTATTCGACT TGCAAAACAT GCCGGTATGA AGATTATGGA GCTTCTACAG 
AATAATATAC GTCCAAGAGA TATTATGTCA GAGAAGGCTT TTCTTAATGC GTTGGCAGTC 
GATATGGCAC TTGGCTGTTC TACAAACAGT ATGTTACACC TACCAGCCAT TGCTCATGAG 
GCAGGAGTTG ATTTAAATGT AGATATCGCA AATGAAATCA GTGCAAAGAC TCCAAACCTA 
TGTCACCTTG CTCCGGCTGG TCATACTTAC ATGGAAGATT TGAATGAAGC CGGCGGTGTC 
TATGCTGTTA TGAATGAACT TGATAAGAAG GGATTATTGT ATACAGACCT AATTACTTGT 
ACAGGTAAGA CTATTAAAGA GAATATTGAA GGCTGTGTAA ATAGAGATCC AGATACAATT 
CGTCCAATTG AAAATCCATA TAGTCAAACT GGTGGAATCG CAGTGTTAAA GGGTAATCTA 
GCGCCAGACT CCGGTGTAGT AAAACGCTCT GCTGTAGCAC CTGAGATGAT GGTGCATGTT 
GGACCTGCAA GAGTATTTGA TTGTGAAGAG GATGCAATTG ACGCAATTAA GAGTGGGAAA 
ATTGTTGCGG GAGATGTCGT AGTAATTCGA TATGAAGGAC CAAAGGGTGG ACCTGGTATG 
CGAGAAATGC TAAACCCTAC CTCTGCTATT GCAGGTATGG GACTTGGTTC TTCTGTTGCA 
TTAATTACAG ATGGCCGTTT CTCTGGTGCA TCCAGAGGTG CATCGATAGG TCACGTATCA 
CCGGAAGCAG CGGTTGGTGG TAATATCGCT CTCATAGAGG AGGGGGATAT CATCAAAATT 
GATATACCGA ATAATTCTCT TAACTTCGTA GTATCCGACG AGGAGTTAGA GAGAAGAAGA 
GTCAATTGGA GCCCAAGAGA GCCCAAAATT ACGACGGGTT ACCTTGCACG TTATACTGCT 
ATGGTTACCT CTGGAAATCG TGGTGCAATT TTAGAAGTTC CACGTGTTAA GTAA

Protein sequence

MKSDAVTKGI QQAPHRSLFN ALGLTKEELD KPLIGIVSSY NEIVPGHMNL DKIVEAVKLG 
VAMAGGTPIV FPAIAVCDGI AMGHIGMKYS LVTRDLIADS TEAMAMAHSF DALVMVPNCD 
KNVPGLLMAA ARVNIPTIFV SGGPMLAGRV HGEKRSLSSM FEAVGAHAAG KMTEEEVEEF 
ENKVCPTCGS CSGMYTANSM NCLTEALGMG LKGNGTIPAV YSERIRLAKH AGMKIMELLQ 
NNIRPRDIMS EKAFLNALAV DMALGCSTNS MLHLPAIAHE AGVDLNVDIA NEISAKTPNL 
CHLAPAGHTY MEDLNEAGGV YAVMNELDKK GLLYTDLITC TGKTIKENIE GCVNRDPDTI 
RPIENPYSQT GGIAVLKGNL APDSGVVKRS AVAPEMMVHV GPARVFDCEE DAIDAIKSGK 
IVAGDVVVIR YEGPKGGPGM REMLNPTSAI AGMGLGSSVA LITDGRFSGA SRGASIGHVS 
PEAAVGGNIA LIEEGDIIKI DIPNNSLNFV VSDEELERRR VNWSPREPKI TTGYLARYTA 
MVTSGNRGAI LEVPRVK