Gene Acry_1046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_1046
Symbol
ID	5160237
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	+
Start bp	1165863
End bp	1167716
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	69%
IMG OID	640552964
Product	dihydroxy-acid dehydratase
Protein accession	YP_001234181
Protein GI	148260054
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.641708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCAAT ACCGTTCCCG CACCTCCACC CACGGCCGCA ACATGGCGGG CGCCCGCGCG 
CTGTGGCGCG CGACCGGCAT GGGCGATGCG GATTTCGGCA AGCCGATCAT CGCCATCGCC 
AATTCCTTCA CCCAGTTCGT GCCGGGCCAT GTGCACCTGA AGGATCTCGG CCAGCTCGTC 
GCCCGCGAGA TCGAGGCGGC CGGCGGGGTG GCGAAGGAAT TCAACACCAT CGCCGTCGAT 
GACGGCATCG CCATGGGTCA TGGCGGCATG CTGTATTCGC TGCCCTCGCG CGAGCTGATC 
GCCGATGCGG TGGAATACAT GGTCAACGCC CATTGCGCCG ACGCGCTGGT CTGCATTTCC 
AACTGCGACA AGATCACGCC GGGCATGCTG ATGGCGGCGA TGCGGCTGAA CATCCCGACC 
ATCTTCGTCT CGGGCGGGCC GATGGAGGCG GGCAAATACA TCGCCGATGG CGAGACCAGG 
GCCGCCGACC TGATCACCGC CATGGTCGTC GCCGCCGACC CGACCAAGAC CGACGAGCAG 
GCCGCGGTGA TGGAACGCTC CGCCTGCCCC ACCTGCGGCT CGTGCTCGGG CATGTTCACC 
GCCAATTCGA TGAACTGCCT GACCGAGGCG CTCGGCCTCG CCCTGCCGGG CAACGGCTCG 
CTGCTCGCCA CCCATGCCGA CCGCAAGCGG CTGTTCGTCG AGGCGGGGTG GCAGATCGTC 
GATCTCGCCC GGCGCTATTA CGAGCAGGAC GACGAGGGCG TGCTGCCGCG CCGGATCGGC 
GGGTTCAAGG CGTTCGAGAA CGCGATGTCG CTCGATATCG CGATGGGCGG GTCGACCAAC 
ACGGTGCTGC ACCTGCTGGC CGCGGCACGC GAGGCGGAAC TCGACTTCAC CATGGCGGAC 
ATCGACCGGC TGTCGCGCCG GGTGCCCAAT CTCTGCAAGG TCTCGCCCTC GGTCAGCAAT 
GTCCACATGG AGGACGTGCA CCGCGCCGGC GGCATCATGG GCATTCTCGG CGCGCTCGAC 
CGCGCCGGGC TGATCCATCG CGACTGCGCC ACGGTGCACG AGAAGACGAT CGGCGAGGCG 
ATCGACCGCT GGGACGTGAT GCGCGGCGGC GAGACGGCGA AGACGCTCTA CAGCGCCGCC 
CCCGGCGGGG TGCGGACGAC GGAGGCGTTC AGCCAGAGCC GGCGCTACGA AAGCCTCGAT 
CTCGACCGCG AGAAGGGCGT CATCCGCGAC GCCGAGCACG CGTTCAGCAA GGATGGCGGG 
CTCGCGGTGC TGTATGGCAA CATCGCGCTC GACGGCGCGA TCGTGAAAAC GGCCGGCGTC 
GATGCGTCGA TCCTCGTCTT CGAGGGGCCG GCGCGGATCT TCGAGAGCCA GGAGGACGCG 
GTCGCCGGCA TTCTCGGCGA CAGGGTGAAG GCGGGCGACG TGGTGCTGAT CCGCTACGAG 
GGGCCGAAAG GCGGGCCGGG GATGCAGGAG ATGCTGTATC CGACCTCGTA CCTGAAATCG 
AAGGGCCTCG GCAAATCCTG CGCGCTGATC ACCGACGGGC GGTTCTCCGG CGGCACGGCG 
GGGCTGTCGA TCGGGCATAT CTCGCCGGAA GCGGCGCAGG GCGGGGCGAT CGGGCTGGTC 
GAGGAGGGCG ACATCATCGC CATCGACATC CCGAACCGCA AGCTCGACGT GAAGCTCGAC 
GAGGCGACGC TGGAAGCGCG GCGCGCGGCG ATGGAGGCGA AGGGCAAGGC GGCGTGGAAA 
CCGGCCGCGC GCGAGCGCGT GGTCTCCGCC GCGCTGCAGG CCTATGCGGC GCTGACCACG 
AGTGCGGCCA ACGGCGCGGT GCGCGACGTG ACGCAGGTGC AGCGCGGGCG CTAG

Protein sequence

MPQYRSRTST HGRNMAGARA LWRATGMGDA DFGKPIIAIA NSFTQFVPGH VHLKDLGQLV 
AREIEAAGGV AKEFNTIAVD DGIAMGHGGM LYSLPSRELI ADAVEYMVNA HCADALVCIS 
NCDKITPGML MAAMRLNIPT IFVSGGPMEA GKYIADGETR AADLITAMVV AADPTKTDEQ 
AAVMERSACP TCGSCSGMFT ANSMNCLTEA LGLALPGNGS LLATHADRKR LFVEAGWQIV 
DLARRYYEQD DEGVLPRRIG GFKAFENAMS LDIAMGGSTN TVLHLLAAAR EAELDFTMAD 
IDRLSRRVPN LCKVSPSVSN VHMEDVHRAG GIMGILGALD RAGLIHRDCA TVHEKTIGEA 
IDRWDVMRGG ETAKTLYSAA PGGVRTTEAF SQSRRYESLD LDREKGVIRD AEHAFSKDGG 
LAVLYGNIAL DGAIVKTAGV DASILVFEGP ARIFESQEDA VAGILGDRVK AGDVVLIRYE 
GPKGGPGMQE MLYPTSYLKS KGLGKSCALI TDGRFSGGTA GLSIGHISPE AAQGGAIGLV 
EEGDIIAIDI PNRKLDVKLD EATLEARRAA MEAKGKAAWK PAARERVVSA ALQAYAALTT 
SAANGAVRDV TQVQRGR