Gene Bpro_1035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_1035
Symbol
ID	4012156
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	-
Start bp	1061850
End bp	1063127
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	71%
IMG OID	637940713
Product	imidazolonepropionase
Protein accession	YP_547886
Protein GI	91786934
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID	[TIGR01224] imidazolonepropionase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.281228
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACAG CCCCCCACCC CGCTGCCGAC GGCATCTGGG AGCATTTGCG CCTGATGCCT 
GGCGCGCTGG CCGACGACAG CCCCGTGGCG ACGAACACCG AGGCCGCCAT CGTCGTCACC 
GAAGGCCGGA TCCGCTGGAT AGGCGCCAGC GCCGCGCTGC CCGCCGGGTT CAGCGCGCTG 
CCGCGTTTTG ACGGCGGCGG CGCGCTGGTG ACGCCCGGCC TGGTCGATTG CCATACCCAT 
CTGGTGTACG GTGGCCAGCG CGCCAACGAG TTCGCCATGC GGCTGGCCGG TGCCAGCTAT 
GAAGAGGTGG CGAAGGCCGG CGGCGGCATC GTCTCCAGCG TGCGCGCCAC CCGTGCGGCC 
GGTGAAGACG AGCTTTTTGC GCAGGCCGCG CCTCGCCTGG AACAACTGCT GGCCGATGGC 
GTGTGCGCCA TCGAAATCAA GTCCGGCTAT GGTCTCGCCC TCGAACACGA GCGCAAGCAG 
CTGCGCGTGG CGCGCCGGCT CGGTGAGGCC TACGGCGTCA CCGTGCGCAC CACCTTCCTC 
GGCGCGCACG CACTGCCGCC CGAGTACGCG GGCCGCAGCC AGGACTACAT CGACCTGGTC 
TGCCGCGAGA TGCTGCCCGC ACTCGCCGCC GAAGGCCTGG TCGATGCGGT GGACGTATTT 
TGCGAACGCA TCGCGTTTTC GCTGAGCGAG ACCGAGCAGG TGTTCCAGGC CGCGCAGCGT 
TTAGGCCTGC CGGTCAAGCT GCATGCCGAG CAGCTCTCCG ACATGGGCGG CGCCGCGCTC 
GCCGCGCGTT ATGGCGCGCT GTCGTGCGAC CACATCGAAC ACCTGTCGCA GGCCGGCATC 
GACGCCATGC GCGCGGCCGG CACGGTGGCC GTGCTGCTGC CCGGCGCCTA CTACACGCTG 
CGCGACACCC ACCTGCCACC GATCGCCGCG CTGCGCGAAG CCGGCGTGCC CATGGCCGTC 
TCGACCGACC ACAACCCCGG CACGTCGCCC GCGCTCAGCC TGCTGCTCAT GGCCAACATG 
GCCTGCACAC TGTTTCGCCT GACCGTGCCG GAAGCGCTGG CCGGCATCAC GCGCCACGCA 
GCCCGTGCGC TCGGACTGCA GGACACGCAC GGCGCACTCG GCGTGGGCCG GCCCGCCAAT 
TTCGTGCTGT GGCAGCTGAA TGACAGCGCC GAGCTGGCCT ACTGGCTGGG CCAGCAGGCG 
CCGCGCACCA TCGTGCGGCA GGGGCGCGTT GCGCTCGACG GGCTCCAGAT CGCCCCCAAC 
GCCAGGATCA CCCCATGA

Protein sequence

MTTAPHPAAD GIWEHLRLMP GALADDSPVA TNTEAAIVVT EGRIRWIGAS AALPAGFSAL 
PRFDGGGALV TPGLVDCHTH LVYGGQRANE FAMRLAGASY EEVAKAGGGI VSSVRATRAA 
GEDELFAQAA PRLEQLLADG VCAIEIKSGY GLALEHERKQ LRVARRLGEA YGVTVRTTFL 
GAHALPPEYA GRSQDYIDLV CREMLPALAA EGLVDAVDVF CERIAFSLSE TEQVFQAAQR 
LGLPVKLHAE QLSDMGGAAL AARYGALSCD HIEHLSQAGI DAMRAAGTVA VLLPGAYYTL 
RDTHLPPIAA LREAGVPMAV STDHNPGTSP ALSLLLMANM ACTLFRLTVP EALAGITRHA 
ARALGLQDTH GALGVGRPAN FVLWQLNDSA ELAYWLGQQA PRTIVRQGRV ALDGLQIAPN 
ARITP