Gene Bpro_2057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_2057
Symbol
ID	4015283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	-
Start bp	2138067
End bp	2139137
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	69%
IMG OID	637941729
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_548885
Protein GI	91787933
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.011824
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.166362
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCC CCATCTCGGA CATCCACATC GCCCAGGCCG ACCCGCTGCC GGAACCCCGG 
CTGCTGCGTG ACGAACTGCC GGCGGGCGAC GCTGAAGCCG AATTCATCGC CGCGTCGCGC 
GCCGCCACCC GCAACATCTT GCGCGGCCTG GACGACCGGC TGCTGGTGGT CGTGGGCCCC 
TGCTCTATCC ACGAGCCCGA GTCGGCGCTC GAGTACGCCG CGCGGCTGCG CCAGGAAGCG 
GTGCGCCTTG GCGAATCGCT GCTGCTGGTG ATGCGCGTTT ACTTCGAAAA GCCGCGCACG 
CGCATGGGCT GGAAGGGCCT GATTTATGAC CCGGGGCTGG ACGGCCAAGG CGACATCGGC 
GAGGGCCTGC GCCACGCGCG GCGCATTTTG CTCGATTGCG CGCGGCTGGG TGTGCCGGCA 
GCCTCTGAAA TCCTGGACTT GGTGACGCCG CAGTATTACG CCGAGCTGTT GACCTGGGGC 
GCGATTGGCG CCCGCACGGT AGAAAGCCCG CTGCACCGGC AGATGGCTTC GGCCCTGTCG 
GCGCCCGTGG GCTTCAAGAA CGCCACCAAC GGCAGCGTGG GCGCGGCCAT CGACGCCATC 
CATGTGGCTG CGCAGCCGCA CCGCTTTCCG ACCATCTCGC TCGAGGGCCG GGCCATGGTC 
ATCACGACCA CCGGCAACCC CGATGGTCAC CTGGTATTGC GCGGCGCCAG TGACGGGCCA 
AACTACGACG CCGCCAGCGT CGGGCGCGCC ACCGAGGCCC TGGAGAAATC CGGCCTGCCG 
CCCCGCCTGG TGATCGACTG CAGCCACGGC AACAGCAACA AGGACTATTC GAGGCAACCT 
GCGGTGGCGG CCGACATTGC GCAGCAGGTC GCCAGCGGCT CGACCGGCAT CTGCGGCCTG 
ATGATTGAAA GCCACCTGGT CGAGGGCCGG CAGGACATCG TCGACGGCCG CAAGGGCCTG 
CACTATGGGC AAAGCGTGAC TGACGCCTGC ATCGGCTGGG AGGCGACCGT GGCCGTGCTG 
GAGCAGCTGG CGGCGGCCGT GCGCCAGCGC CGGGCGGGCG CCATCAGGTA A

Protein sequence

MTIPISDIHI AQADPLPEPR LLRDELPAGD AEAEFIAASR AATRNILRGL DDRLLVVVGP 
CSIHEPESAL EYAARLRQEA VRLGESLLLV MRVYFEKPRT RMGWKGLIYD PGLDGQGDIG 
EGLRHARRIL LDCARLGVPA ASEILDLVTP QYYAELLTWG AIGARTVESP LHRQMASALS 
APVGFKNATN GSVGAAIDAI HVAAQPHRFP TISLEGRAMV ITTTGNPDGH LVLRGASDGP 
NYDAASVGRA TEALEKSGLP PRLVIDCSHG NSNKDYSRQP AVAADIAQQV ASGSTGICGL 
MIESHLVEGR QDIVDGRKGL HYGQSVTDAC IGWEATVAVL EQLAAAVRQR RAGAIR