Gene Bcen_4038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcen_4038
Symbol
ID	4096144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia cenocepacia AU 1054
Kingdom	Bacteria
Replicon accession	NC_008061
Strand	-
Start bp	1207098
End bp	1208339
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	66%
IMG OID	638017332
Product	N-isopropylammelide isopropylaminohydrolase
Protein accession	YP_623900
Protein GI	107026389
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCTGT TCAACGTACG TCTGCGCGGC CGCGACGGCC TGTTCACGAT CGGCGTCGAT 
GCCGGCAAGA TCGCGCGGAT CGATGCGCAA ACCGCGCCGA TCGCGTCGAC GAACCCCGAC 
CATATCGACG GCGGCGGCCG TCTCGCGATT GCGCCGCTCG TCGAGCCGCA TATCCACCTC 
GATGCCGTGC TGACGGCCGG CGAACCCGCG TGGAACATGA GCGGCACGCT GTTCGAAGGC 
ATCGAGCGCT GGGCCGAGCG CAAGGCGACG ATCACGCACG AGGACACCAA AGCGCGCGCG 
CATGCGGCGA TCGGCATGCT GCGCGACCAC GGGATCCAGC ACGTGCGCAC GCACGTCGAC 
GTGACCGATC CGACGTTGGC CGCGCTGAAG GCGATGCTGG AAGTGAAGGA CGAGGCGCGC 
GGGCTGATCG ATCTGCAGAT CGTCGCGTTC CCGCAGGAGG GCATCGAATC GTTCGACGGC 
GGCCGCGCGC TGATGGAGCA GGCGATCGAG CTCGGCGCGG ACGTCGTCGG CGGAATTCCG 
CATTTCGAGA ACACGCGGGA GCAGGGCGTC AGCTCGATCC GCTTTCTGAT GGATCTCGCG 
GAACGCACGG GCTGCCTCGT CGACGTGCAC TGCGACGAAA CCGACGATCC GCATTCGCGC 
TTTCTCGAAG TGCTCGCGGA AGAAGCGCGC GTGCGCGGCA TGGGCGCGCG GGTCACCGCG 
AGCCACACGA CCGCGATGGG TTCGTACGAC AACGCGTACT GCTCGAAGCT GTTCCGGCTG 
CTGAAGCGGG CGGGACTGAA CTTCATCTCG TGCCCGACCG AGAGCATTCA CCTGCAAGGG 
CGCTTCGACA CGTTTCCGAA GCGGCGCGGC GTCACGCGCG TCGCGGAACT CGACCGGGCC 
GGCATCAACG TGTGCTTCGG GCAGGATTCG ATCAAGGACC CGTGGTATCC GCTCGGCAAC 
GGCAACATCC TGCGCGTGCT CGATGCGGGC CTTCATATCT GTCACATGAT GGGTTACCAG 
GACCTGCAGC GCTGCCTCGA CTTCGTGACC GACCACAGCG CGACGACGAT GCATCTCGGC 
GAGGGCTACG GCATCGAGAT CGGGCGTCCG GCGAATCTCG TCGTGCTCGA CGCGGACAGC 
GATTACGAAG CCGTACGCCG GCAGGCGAAG GCCACGCTGT CGATGCGCCA CGGGAAGGTC 
ATCATGCGGC GTGAGCCGGA GCGCATCACG TATCCGGATT GA

Protein sequence

MNLFNVRLRG RDGLFTIGVD AGKIARIDAQ TAPIASTNPD HIDGGGRLAI APLVEPHIHL 
DAVLTAGEPA WNMSGTLFEG IERWAERKAT ITHEDTKARA HAAIGMLRDH GIQHVRTHVD 
VTDPTLAALK AMLEVKDEAR GLIDLQIVAF PQEGIESFDG GRALMEQAIE LGADVVGGIP 
HFENTREQGV SSIRFLMDLA ERTGCLVDVH CDETDDPHSR FLEVLAEEAR VRGMGARVTA 
SHTTAMGSYD NAYCSKLFRL LKRAGLNFIS CPTESIHLQG RFDTFPKRRG VTRVAELDRA 
GINVCFGQDS IKDPWYPLGN GNILRVLDAG LHICHMMGYQ DLQRCLDFVT DHSATTMHLG 
EGYGIEIGRP ANLVVLDADS DYEAVRRQAK ATLSMRHGKV IMRREPERIT YPD