Gene PA14_23240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PA14_23240
Symbol
ID	4381163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas aeruginosa UCBPP-PA14
Kingdom	Bacteria
Replicon accession	NC_008463
Strand	-
Start bp	2011997
End bp	2013331
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	69%
IMG OID	639324425
Product	N-ethylammeline chlorohydrolase
Protein accession	YP_790010
Protein GI	116051159
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.00576591
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCAACG TCCGTAACCC CTTCGACCTC CTCCTGCTGC CGACCTGGAT CGTCCCCGTG 
GAGCCCGCCG GGGTGGTGCT GCGCGATCAC GCGCTGGGCA TCCGCGACGG CCAGATCGCC 
CTGGTCGCGC CGCGCGAGCA GGCCATGCGC CATGGCGCCA CGGAAATCCG CGAATTGCCC 
GGCATGCTGC TCGCCCCCGG CCTGGTCAAC GCCCACGGCC ATTCGGCAAT GAGTCTGTTC 
CGCGGTCTCG CCGACGACCT GCCGCTGATG ACCTGGCTGC AGGACCACAT CTGGCCGGCC 
GAAGGCCAAT GGGTCAGCGA GGACTTCATC CGCGACGGCA CGGAGCTGGC CATCGCCGAA 
CAGGTAAAGG GCGGCATCAC CTGTTTCTCC GACATGTACT TCTATCCACA GGCCATCTGC 
GGCGTGGTCC ATGACAGCGG GGTACGCGCC CAGGTGGCGA TCCCGGTGCT GGACTTCCCG 
ATCCCCGGCG CCCGCGACAG CGCCGAGGCG ATCCGCCAGG GCATGGCACT GTTCGACGAC 
CTCAAGCACC ACCCGCGCAT CCGCATCGCC TTCGGCCCGC ACGCCCCTTA TACGGTGAGC 
GACGACAAGC TGGAGCAGAT CCTGGTGCTC ACCGAGGAAC TCGACGCCAG CATCCAGATG 
CACGTCCACG AGACCGCCTT CGAGGTGGAG CAGGCCATGG AGCGCAACGG CGAGCGCCCG 
TTGGCCCGCC TGCACCGCCT CGGCCTGCTC GGCCCGCGCT TCCAGGCGGT GCACATGACC 
CAGGTAGACG ACGACGACCT GGCGATGCTG GTGGAAACCA ACAGTTCGGT GATCCACTGC 
CCGGAATCCA ACCTCAAGCT GGCCAGCGGC TTCTGCCCGG TGGAAAAGCT CTGGCAGGCC 
GGGGTCAACG TGGCCATCGG CACCGACGGC GCGGCCAGCA ACAACGACCT CGACCTGCTC 
GGCGAGACCC GCACCGCGGC GCTGCTGGCC AAGGCAGTGT ACGGCCAGGC CACCGCCCTC 
GACGCCCACC GCGCGCTGCG CATGGCCACC CTGAACGGAG CCCGCGCGCT TGGCCTGGAG 
CGCCTGATCG GCTCCCTGGA AGCCGGCAAG GCCGCCGACC TGGTGGCCTT CGACCTGTCC 
GGCCTGGCCC AGCAACCGGT CTACGACCCG GTTTCGCAAC TTATCTATGC CAGCGGCCGC 
GACTGCGTGC GGCATGTCTG GGTCGGCGGC AGGCAACTCC TCGACGACGG CCGCCTGCTC 
CGTCACGACG AACAGCGCCT GATCGCCAGG GCCCGCGAAT GGGGGGCGAA GATCGCCGCC 
AGCGACAGGT CCTGA

Protein sequence

MPNVRNPFDL LLLPTWIVPV EPAGVVLRDH ALGIRDGQIA LVAPREQAMR HGATEIRELP 
GMLLAPGLVN AHGHSAMSLF RGLADDLPLM TWLQDHIWPA EGQWVSEDFI RDGTELAIAE 
QVKGGITCFS DMYFYPQAIC GVVHDSGVRA QVAIPVLDFP IPGARDSAEA IRQGMALFDD 
LKHHPRIRIA FGPHAPYTVS DDKLEQILVL TEELDASIQM HVHETAFEVE QAMERNGERP 
LARLHRLGLL GPRFQAVHMT QVDDDDLAML VETNSSVIHC PESNLKLASG FCPVEKLWQA 
GVNVAIGTDG AASNNDLDLL GETRTAALLA KAVYGQATAL DAHRALRMAT LNGARALGLE 
RLIGSLEAGK AADLVAFDLS GLAQQPVYDP VSQLIYASGR DCVRHVWVGG RQLLDDGRLL 
RHDEQRLIAR AREWGAKIAA SDRS