Gene Achl_0143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_0143
Symbol
ID	7291569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	156438
End bp	158198
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	65%
IMG OID	643588542
Product	Dihydroxy-acid dehydratase
Protein accession	YP_002486235
Protein GI	220910926
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	100
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGACC CGAATTACAT GGATCTCCGC AGCGCACGCT GGTTCGCGCC GCACGATCTC 
ACCGGTTTCG TGCACCGTAC CGCCATCCAG GCCGAAGGTT TCTCGCGCTT CGCCATCAAG 
GACCGGCCGG TGATCGGCAT CGCCAACTCC TGGTCGGAGC TGGTCAACTG CAACATCCAT 
TTCAAGCTGC TTGCCGAGGC TGTGAAGCGC GGCGTCCTAA TGGCCGGGGG CCTACCCTTG 
GAGTTCCCCA CCATCTCCCT GGGGGAGAGC CTGATGAAGC CCTCAGCCAT GCAGTTCCGC 
AACCTCATGG CCATGGACGT GGAGGAATCC ATCCGCGCGT ATCCGCTGGA TGCGATCGTG 
CTGCTGGGCG GCTGCGACAA GACCGTTCCT GCCCAGCTCA TGGGCGCCGC CAGCGCCGAT 
ATTCCCACCA TCATGCTCAC CGGCGGCCCC CAGGAGCCGG CCCACTTCCG GGGCAAGCAG 
CTTGGCGTCG GAACGGACAC CTGGAAGTAC GCAGACGAGC TGCGGGCCGG TAAGATCACC 
GAGGCCGACT TTGACGAGCT CGAATCCGCG GCCAAGCCTT CCGCTGGCCA CTGCAGCGAA 
ATGGGCACGG CGTCCACCAT GACGTCCCTC GTTGAGGCCT TGGGCATGTG TCTGCCCGGC 
AGCGCTTCCA TTCCGGCCGT CGATTCACGC CGCGGCCAGG CAGCAGAGGC CACGGGACGC 
CGGGCCGTGG AAATGGCATT GTCCCAGGGG CCGAAGCCCA GCGAAATTCT GACCAAGGAA 
GCGTTCGATA ACGCCATTAC GCTCCTCATG GCCGTGGGCG GATCCACCAA CGCCGTGGTC 
CACCTCCTGG CGTTGGCGCG AAGGGTGGGC TACGAACTGC AGCTTGACCG CTTCCACGAA 
ATTTCGCAGC GGACCCCGCG CATCGTAAAC GTCCGTCCTT CCGGCGAGTA CCTCGTGAAG 
CAACTCTTCG AGGTTGGCGG CATTCCCACC GTGCTCAAGG CCCTTGACCC CCTGCTGAAC 
CGGGACGCCA TAACCGTCAC CGGCGAGTCC CTCGAGAAGG GCTACATCCA CGCGCCCGAG 
GCGGATGGAG TCGTCGTGAG CTCGCTTGAG GCGCCCTTCG ACGCCTCCGG TGGCATCGCC 
GTCGTCCGTG GTTCCCTGGC TCCGAACGGT GCGGTGATTA AGCGCAGTGC AGCTTCTAAG 
GACCTGCTGC AGCACAAGGG CTCGGCCATT GTCTTCGACG ACATCTACGA TCTCGGACGG 
CGGATCGACG ATCCGGACCT GGACATCACC GAGGATTCGG TCCTGGTGCT CCGTAACAGC 
GGGCCCGTCG GCGCGCCCGG CATGCCCGAG TGGGGCATGC TGCCAATCCC GCAGAAGCTG 
CTGCGCAGGG GCATCCGGGA CATTGTGCGC ATCTCCGATG CCCGCATGAG CGGCACCGCA 
TTCGGCACGA CCGTGCTCCA TGTCTCGCCC GAGGCTGCGG TAGGTGGTCC GCTGGCGATC 
GTCCGTGACG GCGATCCGAT AGTGCTGGAT GTCGAGAACC AGCGGCTGGA CCTTGATCTC 
CCCGAGGAAG AGATCGAGGC CAGGCTTGCG GAGTTGAAGC TGCCCGAGCC CAAGTACCGC 
CGCGGCTATG GACGCCTGTT CCTCGACCAC GTCAACCAAG CGCACGAAGG CTGCGACTTC 
GACTTCCTCA AAGGCCTGCC GGATGAGGAG CCCCAGCGGC TGCCCTACGG CCTGATGAGC 
GGCTGGCAAG GCGGCTGGTA G

Protein sequence

MPDPNYMDLR SARWFAPHDL TGFVHRTAIQ AEGFSRFAIK DRPVIGIANS WSELVNCNIH 
FKLLAEAVKR GVLMAGGLPL EFPTISLGES LMKPSAMQFR NLMAMDVEES IRAYPLDAIV 
LLGGCDKTVP AQLMGAASAD IPTIMLTGGP QEPAHFRGKQ LGVGTDTWKY ADELRAGKIT 
EADFDELESA AKPSAGHCSE MGTASTMTSL VEALGMCLPG SASIPAVDSR RGQAAEATGR 
RAVEMALSQG PKPSEILTKE AFDNAITLLM AVGGSTNAVV HLLALARRVG YELQLDRFHE 
ISQRTPRIVN VRPSGEYLVK QLFEVGGIPT VLKALDPLLN RDAITVTGES LEKGYIHAPE 
ADGVVVSSLE APFDASGGIA VVRGSLAPNG AVIKRSAASK DLLQHKGSAI VFDDIYDLGR 
RIDDPDLDIT EDSVLVLRNS GPVGAPGMPE WGMLPIPQKL LRRGIRDIVR ISDARMSGTA 
FGTTVLHVSP EAAVGGPLAI VRDGDPIVLD VENQRLDLDL PEEEIEARLA ELKLPEPKYR 
RGYGRLFLDH VNQAHEGCDF DFLKGLPDEE PQRLPYGLMS GWQGGW