Gene PA14_72010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PA14_72010
Symbol
ID	4384950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas aeruginosa UCBPP-PA14
Kingdom	Bacteria
Replicon accession	NC_008463
Strand	+
Start bp	6418319
End bp	6419947
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	67%
IMG OID	639328403
Product	putative glycosyltransferase
Protein accession	YP_793932
Protein GI	116053605
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTTCA TCCTTTACTC GGATATCAAC GAGCGCTCGA TCGGCCACAA CCTCGGTCGC 
CCCGAATACA GCTACTACTT CGTCCTCAAG GCCTACCGGC CAATCCTCGA ATCGCTGGGA 
CAGGTCCACC TGGTACAGAG CACGGACGAA GTCGACCCGC TCTATCGGCA ACTGCATGAA 
CAGGGCGAAG ACTGCCTGTT CCTCTCCTTC ACCCCGCCGC ACAAGGCGGC GCGGGGCCTG 
CAATGCCCGA TGCTGTGCGT GGTCGCCTGG GAGTTCGAGT CGATTCCCGA CGTGGCGTGG 
GACGGCGATC CGGCGCAGGA CTGGAGCCAG GTCCTGGCCG GCCATGGCGC AGCCATCACC 
CTCTCCGAAC AGACTGCCCA CGCGGTTCGC CGGGTGCTGG GCGAAGATTT TCCGGTACTG 
GCGCTGCCGA CGCCGATCTG GGAGGAGTTC GCCGCGATCC GCCAGCAAGG CGAGCGGAAT 
CCGGTCAAGT CCGCCGAGAC CCTGCAACTC AAGGGCTGCG TCATCGACAG TCGCCTGCTG 
GGCCTTTCCG CCGACGGCCT CATCGCACCG ATCAGGGAAG AGACCGAGGA TGAGATCCTC 
GAGGTCCTCC CCGAGACGCC CGCCGAGCCC GAGCCCGAAC CGGTCCCTGA GCCAGAACCA 
GAGCCAGAGC CGGTTCCTCT CGACTGGAGG CGCCGACTGG TCATCAGCAA GCACTACCTG 
CTGCTGTGGT ACCGGGAAGC TGTCAGCGAC CTGGTACCCA TGCCGGTACG CCGCTGGCTG 
TTCCGTCACC TGCGCCAGCC GCTGCCGCAC CCGCCAACGG CGCTGGAAAC GCTGCCGGAG 
CCATTGCCCC AGGCCATCGA GCCGATGCCG CCCGCCGAGC CCGAGCATCC GCCGGCGCTG 
CTGCCGGACG TCGACCAGCA CCAGCAGGTC GTCGTGGACG GGGTGGTCTA CGTCTCGGTG 
TTCAATCCGC TGGACGGGCG CAAGAACTGG CATCAGCTGA TCACCGCCTT CTGCTGGGCA 
TTCCGCGACA CCAGCGATGC CACGCTGGTG CTGAAGATGA CCCAGAGCGA CCTGACGACC 
TACCACGTCG AACTGCTCAC CCTGCTTTCC CAACTGTCGC CGTTCGCCTG CCGGGTCATC 
GCCCTGCACG GCTATCTCGA CGCCGCGGAG TACGCCCGTC TGTACGGAGC CGCCAGCTAC 
TACGTGAACG CCTCGCGCTG CGAGGGCCTG TGCCTGCCGC TGATGGAGTT CATGTCCTGC 
GGCACCCCGG CGATCGCTCC GGACCATTCG GCGATGGCCG ACTACATGGA CGCCCAGGTG 
GGCTTCGTGG TCCGCTCCAG CCAGGAGCCC GCGGCCTGGC CGCAGGATTC GCGCCGGTTG 
TACAGCACCC GGCGCTACCG GCCGAGCTGG GAGTCCCTGA AGGAGGCCTA CCTGGAGAGC 
TACCGGGTGG CCCGGGAACA GCCGGAGCGC TATCGGCAGC TGTCCGCCGC GGCCAACCAA 
CGCATGCGCG GCTACTGCGC CGGCGACGTG GTCCGCCAGC GCCTGGAACC CTTCCTTTCC 
GCTCGCAAGG CAACCCCTGC GCCCGGCGTC GAACTGGCGG CCACCGCCAC AGGCAACGTT 
CCATGCTGA

Protein sequence

MNFILYSDIN ERSIGHNLGR PEYSYYFVLK AYRPILESLG QVHLVQSTDE VDPLYRQLHE 
QGEDCLFLSF TPPHKAARGL QCPMLCVVAW EFESIPDVAW DGDPAQDWSQ VLAGHGAAIT 
LSEQTAHAVR RVLGEDFPVL ALPTPIWEEF AAIRQQGERN PVKSAETLQL KGCVIDSRLL 
GLSADGLIAP IREETEDEIL EVLPETPAEP EPEPVPEPEP EPEPVPLDWR RRLVISKHYL 
LLWYREAVSD LVPMPVRRWL FRHLRQPLPH PPTALETLPE PLPQAIEPMP PAEPEHPPAL 
LPDVDQHQQV VVDGVVYVSV FNPLDGRKNW HQLITAFCWA FRDTSDATLV LKMTQSDLTT 
YHVELLTLLS QLSPFACRVI ALHGYLDAAE YARLYGAASY YVNASRCEGL CLPLMEFMSC 
GTPAIAPDHS AMADYMDAQV GFVVRSSQEP AAWPQDSRRL YSTRRYRPSW ESLKEAYLES 
YRVAREQPER YRQLSAAANQ RMRGYCAGDV VRQRLEPFLS ARKATPAPGV ELAATATGNV 
PC