Gene Bpro_4072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_4072
Symbol
ID	4013244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	+
Start bp	4280358
End bp	4281563
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	61%
IMG OID	637943720
Product	enamidase
Protein accession	YP_550863
Protein GI	91789911
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.815996
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0735984
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAAG CAGCATCGAC CGGCAAATCA GGAAAAGTCG TCATCAGGAA TATCGGCTTG 
CTGCTGTCCG GAGACATCGA CAAACCCATC CTGGATGCGG ACACCATTGT CGTGAACGAT 
GGCCTGATCG TGGCTGTCGG CAAGGCCAAG GACTGCGACA TCGCGCATGC GCAGACCGTT 
ATTGACGCGC ACCAGACCTG CGTCTGTCCG GGTTTGATAG ACAGCCATGT CCATCCGGTA 
TTTGGTGACT GGACGCCACG GCAAAACCAG ATTGGCTGGA TCGACTCCAC CATGCACGGC 
GGCGTCACCA CGATGATCTC GGCCGGAGAA GTTCATCTTC CCGGGCGGCC CAAGGACATT 
GTTGGCCTCA AAGCGCTGGC CATTACGGCG CAGCGCGCGT TTGACAATTT TCGCCCCGGT 
GGCGTCAAGG TTCTTGCCGG CGCACCCATC ATCGAAAAAG GCATGACCGA GCAGGATTTC 
AAGGATTTGG CCGAGGCCGG CGTCACGCTG CTTGGCGAGG TCGGCCTGGG TTCCGTCAAG 
GCGGGCTACG AGGCCAAGGA AATGGTGGGC TGGGCGCGCA AGTACGGCAT CCAGAGCACC 
ATCCATACAG GCGGCCCCTC CATTCCCGGC TCCGGCCTGA TTGACAAGGA TGTGGTGCTT 
GAAGCCGATG CCGACGTCAT TGGCCACATC AACGGCGGGC ACACGGCATT ATCGGAGGCG 
CATGTCTGCG AGCTGTGCGA AAGGTCCTCT CGCGCCATCG AGATTGTCCA CAACGGCAAT 
GAAAAAGTGG CGATCGCGGC CGCTCAAGCC GCGCTGCAGC TCAAATGTCC GCACCGTGTC 
ATTCTGGGCA CCGATGGCCC GGCCGGATCA GGCGTGCAAC CCCTGGGCAT GTTGCGGCTC 
ATCGCCCTGC TCTCAAGCCT GGGAAACATT CCGGCCGAAT TGGCGCTCTG TTTTGCCACC 
GGCAATACCG CGCGCATTCG CAATCTCAAT TGCGGGCTGA TCGAAGTCGG TCGCGCCGCT 
GACTTCGTGT TCATGGACAA GGCCCAGCAT TCTGCCGGGC TTGACCTCCT GGACAGCATT 
CAATGCGGTG ACATTCCGGG GGTGGGCATG GTGATGATTG ACGGCATGGT GCGCTGCGGC 
CGCAGCCGGA ACACCCCGCC GGCCACACAA ATCCCCGGTG TTCAACACCA CACCGTTCCC 
GCCTGA

Protein sequence

MAEAASTGKS GKVVIRNIGL LLSGDIDKPI LDADTIVVND GLIVAVGKAK DCDIAHAQTV 
IDAHQTCVCP GLIDSHVHPV FGDWTPRQNQ IGWIDSTMHG GVTTMISAGE VHLPGRPKDI 
VGLKALAITA QRAFDNFRPG GVKVLAGAPI IEKGMTEQDF KDLAEAGVTL LGEVGLGSVK 
AGYEAKEMVG WARKYGIQST IHTGGPSIPG SGLIDKDVVL EADADVIGHI NGGHTALSEA 
HVCELCERSS RAIEIVHNGN EKVAIAAAQA ALQLKCPHRV ILGTDGPAGS GVQPLGMLRL 
IALLSSLGNI PAELALCFAT GNTARIRNLN CGLIEVGRAA DFVFMDKAQH SAGLDLLDSI 
QCGDIPGVGM VMIDGMVRCG RSRNTPPATQ IPGVQHHTVP A