Gene Bpro_1034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_1034
Symbol
ID	4012155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	-
Start bp	1060402
End bp	1061853
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	71%
IMG OID	637940712
Product	N-formimino-L-glutamate deiminase
Protein accession	YP_547885
Protein GI	91786933
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02022] formiminoglutamate deiminase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0932501
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA TCGCCCCCTT CGCTGCCCCG ACATCCCATG CCCCAGCCAT GGGCAGCCTG 
TTTGCCACCG ATGCCCTGCT GCCCGACGGC TGGGCGCGCA ACGTGCTGCT GGAATGGAAC 
GCCGCCGGCC AGCTGCTGGC CGTCACGCCG GACAGCAGCG CCCCGCGCAC CACGCCCCGG 
GCCGCCGGCC CCCTCATCCC GGGCATGCCC AACCTGCATT GCCACGCCTT CCAGCGGGCC 
TTTGGCGGAC TGACGGAGTT TCGCGCCGAG GCGCAGGACA GCTTCTGGAG CTGGCGCACG 
CTGATGTACC GCTTCGCCGC GCAGGTCACG CCCGAGCTGC TGGAAGACAT CGCCACCTGG 
CTTTACATCG AGATGCTGGA GGCCGGCTAC ACCTCGGTGT GTGAATTCCA CTACGTGCAC 
CACGACCTGG ACGGCCGGCC CTATGCCGAC GACGCCACGC TGGCCCAATG CCTGTTGCGT 
GCCGCACAGC GCGCCGGCAT CGGCATCACG CTGCTGCCCG TGCTTTACCA GACCAGCGGT 
TTTGGCGGCA CGCCGCCAAA TGCGGGGCAA CGCCGCTTCA TCCGGTCTAC CGACTCGATG 
CTGCGCCTGC TGGAGCGCCT GCAGCCTTGT TGCGAGGTGC AGGGCGCGCG CCTGGGGCTG 
GCGCCGCACT CCCTGCGCGC GGTGCCGCCC GACAGCCTGC GCGAGGTGCT GGCCGGACTG 
GACGCCATCG ACCCCACCGC GCCCATACAC ATCCATATTG CCGAGCAAAC GGCCGAGGTG 
GATGCCTGCC TGGCCTGGAG CGGCCAGCGC CCGGTGGAGT GGCTCTTGGA CCACGCCGCC 
GTCGATGCGC GCTGGTGCCT GGTGCACGCC ACGCACATGA CCGACACCGA ATATCAGCGC 
GCCGCCCGCA CTGGCGCCGT GGCCGGCCTG TGCCCGACCA CCGAGGCCAA TCTGGGAGAC 
GGCATTTTTG ACCTGCCGCG CTGGCGCGCC GCCGGGGGCG CCTGGGGCGT CGGCTCGGAC 
AGCAACGCCT GCGTCAACGC GGCGGAAGAG CTGATGCTGC TTGAATATGG TCAGCGCCTG 
CAGGGTCGCC AGCGCAATGT GCTAGCCACC GCGCAGCAAC CGCAGGTCGC CACCGCGATG 
ACGCTGCAGG CCGTGCAGGG CGGCGCCCGT GCCTCGGGTC GTGCCTTGCC GCGCGGCACT 
GCCGGACTGG TTACCGGCCA GCGCGCCGAT TTTGCGGTGC TGGACGCCCG GCACCCGGCC 
TTGTGCGAGC TGAGCGCGCC CGACATGCTG TCGGCCCATG TGTTCGCCAG CCACCGCACG 
TCCGCGCTCG ACGCGGTCTG GGTCGGCGGC GTTCAGCAAA CCCGCCAGGG CAGCCGCCAT 
CCGCTGCGCG AGACGGCCGC CGCGGCCTTC ATCGCCGCCC GCTCACGCCT GCTGGCGCAA 
ACCCAGGCCT GA

Protein sequence

MSDIAPFAAP TSHAPAMGSL FATDALLPDG WARNVLLEWN AAGQLLAVTP DSSAPRTTPR 
AAGPLIPGMP NLHCHAFQRA FGGLTEFRAE AQDSFWSWRT LMYRFAAQVT PELLEDIATW 
LYIEMLEAGY TSVCEFHYVH HDLDGRPYAD DATLAQCLLR AAQRAGIGIT LLPVLYQTSG 
FGGTPPNAGQ RRFIRSTDSM LRLLERLQPC CEVQGARLGL APHSLRAVPP DSLREVLAGL 
DAIDPTAPIH IHIAEQTAEV DACLAWSGQR PVEWLLDHAA VDARWCLVHA THMTDTEYQR 
AARTGAVAGL CPTTEANLGD GIFDLPRWRA AGGAWGVGSD SNACVNAAEE LMLLEYGQRL 
QGRQRNVLAT AQQPQVATAM TLQAVQGGAR ASGRALPRGT AGLVTGQRAD FAVLDARHPA 
LCELSAPDML SAHVFASHRT SALDAVWVGG VQQTRQGSRH PLRETAAAAF IAARSRLLAQ 
TQA