Gene Bpro_2052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_2052
Symbol
ID	4015278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	-
Start bp	2132690
End bp	2134384
Gene Length	1695 bp
Protein Length	564 aa
Translation table	11
GC content	63%
IMG OID	637941724
Product	dihydroxy-acid dehydratase
Protein accession	YP_548880
Protein GI	91787928
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0538673
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAACCA AGACCATTCA GCTCAACCCC CGCAGCAAAA ACATCACCGA AGGCAAATCG 
CGCGCGCCCA ACCGCTCGAT GTACTACGCC ATGGGCTATG AAGAGGCCGA CTTCAAGAAG 
CCCATGATTG GTGTGGCCAA CGGGCACAGC ACCATCACCC CCTGCAACAG CGGCCTGCAA 
AAGCTGGCGG ACGCGGCCAT TGCCGGCATT GAAGAAGCCG GCGGCAACGC CCAGGTGTTC 
GGCACGCCCA CCATCTCGGA CGGCATGGCC ATGGGCACCG AGGGCATGAA GTACTCGCTG 
GTCAGCCGCG AAGTGATCTC CGACTGCATC GAAACCTGCG TGCAGGGCCA GTGGATGGAC 
GGCGTGCTGG TGATCGGCGG CTGCGACAAG AACATGCCCG GCGGCCTGAT GGGCATGCTG 
CGCGCCAACG TGCCGGCCAT CTACGTCTAT GGCGGTACCA TTTTGCCGGG CAGCTACAAG 
GGCAAAGACC TCAACATCGT CAGCGTGTTT GAAGCCGTCG GCGAAAACGC AGCAGGCCGC 
ATGAGCGATG AAGACCTGCT GCAAATCGAG CGCCGCGCCA TTCCCGGCAC CGGTAGCTGC 
GGCGGCATGT ACACGGCCAA CACCATGTCC AGCGCCTTCG AGGCGCTCGG CATTTCGCTG 
CCCTACTCCA GCACCATGGC CAATCCGCAC GACGAGAAAA TGAACTCGGC CAGGGAGTCC 
GCCAAGGTCC TGGTCGAAGC CATCAAGAAA GACATCAAGC CGCGCGATCT CGTCACGAAG 
AAAGCCATTG AAAACGCCGT GGCAGTGATC ATGGCCACGG GCGGCTCCAC CAATGCCGTG 
CTGCACTTCC TGGCGATTGC GCATGCCGCC GGCGTGGACT GGACAATCGA CGACTTCGAA 
CGCGTGCGCC AAAGAACGCC GGTGCTGTGC GACCTGAAGC CGTCCGGCAA GTACCTGGCC 
GTGGACCTGC ACCGCGCCGG CGGCATTCCG CAGGTCATGA AGATGCTGCT GGCGGCCGGC 
CTGCTGCATG GCGACTGCCT GACGATCACC GGCCAAACCA TTGCCGAGGT GCTGAAGGAT 
GTGCCCGAAG CGCCGCGCGC CGACCAGGAC GTGATTCGCC CCATCAGCAA CCCCATGTAC 
GCCCAGGGCC ACCTGGCCAT CCTGAAGGGC AACCTCTCGC CTGAAGGCTG CGTGGCCAAA 
ATCACCGGCC TGAAAAACCC GGTCATGACG GGCCCGGCCC GCGTATTTGA CGACGAGCAG 
TCGGCGCTGG CCGCCATCCT GGCCGGCAAG ATCAAGGCGG GCGACGTGAT GGTGCTGCGT 
TACCTCGGCC CCAAGGGCGG TCCCGGCATG CCTGAAATGC TGGCGCCTAC CGGTGCGCTG 
ATTGGCGCCG GCCTGGGCGA AAGCGTGGGC CTGATCACCG ACGGCCGCTT CTCCGGCGGC 
ACCTGGGGCA TGGTAGTCGG CCATGTGGCC CCCGAAGCGG CCGCCGGCGG CAATATCGCA 
TTCATCAACG AAGGCGACTC CATCACCATT GACTCAAAAC AGTTGCTGCT GCAACTGAAC 
ATCAGCGACG CGGAGCTGGA AAAACGCAAG GTCGGCTGGA AAGCACCGGC ACCGCGCTAC 
AACCGCGGCG TGCAGGCCAA GTTTGCCTTC AACGCGTCGA GTGCCAGCAA GGGTGCGGTG 
CTGGACGACT ATTGA

Protein sequence

METKTIQLNP RSKNITEGKS RAPNRSMYYA MGYEEADFKK PMIGVANGHS TITPCNSGLQ 
KLADAAIAGI EEAGGNAQVF GTPTISDGMA MGTEGMKYSL VSREVISDCI ETCVQGQWMD 
GVLVIGGCDK NMPGGLMGML RANVPAIYVY GGTILPGSYK GKDLNIVSVF EAVGENAAGR 
MSDEDLLQIE RRAIPGTGSC GGMYTANTMS SAFEALGISL PYSSTMANPH DEKMNSARES 
AKVLVEAIKK DIKPRDLVTK KAIENAVAVI MATGGSTNAV LHFLAIAHAA GVDWTIDDFE 
RVRQRTPVLC DLKPSGKYLA VDLHRAGGIP QVMKMLLAAG LLHGDCLTIT GQTIAEVLKD 
VPEAPRADQD VIRPISNPMY AQGHLAILKG NLSPEGCVAK ITGLKNPVMT GPARVFDDEQ 
SALAAILAGK IKAGDVMVLR YLGPKGGPGM PEMLAPTGAL IGAGLGESVG LITDGRFSGG 
TWGMVVGHVA PEAAAGGNIA FINEGDSITI DSKQLLLQLN ISDAELEKRK VGWKAPAPRY 
NRGVQAKFAF NASSASKGAV LDDY