Gene PA14_52020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PA14_52020
Symbol
ID	4380023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas aeruginosa UCBPP-PA14
Kingdom	Bacteria
Replicon accession	NC_008463
Strand	-
Start bp	4616482
End bp	4617519
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	68%
IMG OID	639326766
Product	hypothetical protein
Protein accession	YP_792329
Protein GI	116048870
COG category	[S] Function unknown
COG ID	[COG3249] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.00203193
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCATAG CCCGACTCTT CGTTCTCTGT TTTTCCCTGC TAGGCTTGCC CGTCTTCGCG 
GCAACGGTCC CCAATCTCTA CCAGGTCCAC GAGCCGGTTT CGTCGCAGCA GCCCGGGGAG 
CGCGATGCCG GACTGGTGCG AGCCCTGCAG ACCCTGCTGG TGCGCCTGAC CGGCAATCCG 
CAGGCGCCGC AGAACCCGGC ATTGGCGGGG TACCTGAAGG ATCCGCAGCA ACTGATCAGC 
CAGTACGCCT TCGAAAATGG TCCGCCGCTG GCGCTGGTGG TCGATTTCGA TCCAACCGCC 
ACCGGTAATG CGCTGCGTGC CGCCGGCCTG CCGAGCTGGG GCGCCAACCG CCCGGCGGTG 
CTGGCCTGGT GGCTGAACGA AAGCGCCGAT GGCAGCACCC TGGTCGGTGA CAACCAGGCC 
TCGGCCGAAC CGCTCAAGCG TGCGGCGCAG AACCGCGGCT TGCCGTTGCG CCTGCCTCTG 
GCGGATCTCG ACGAACAGAT CGTCGGTACC CCGGAGAACC TCACCGCCGC CCAACCCGAT 
GCCCTGCGCG CAGCCTCCGA GCGTTATGCC GCCGATGCCT TGCTGGCAGT GGACGCCAAG 
GAGGCGGACG GCAAATGGCA GGCGCAATGG CGGCTGTGGA TGGGCGATTC GCGGGAGCAA 
GGCCAGGCTG AAGGCGCTAC GCCCGACGCG TTGGCAGACA GCGTGATGCT GGCCGTCGGC 
AACCGCCTGT CTACCCGTTT CGTTGCCACG CCGGGAGCGG CGACCGGCCT GACCCTCCAG 
GTCCAGGGCG CGACACTGGC ACGCTATGCC GAGTTGCAAC GCCTGCTCGA TCCGTTCGGC 
GCGCGTCTGG TAGGCGTGCG GGGCGATCGC CTCGACTATT CCGTGAAGGC CAGTCCCGAG 
CAATTACGTG CCCAGCTGGG CCTGGCGCAG TTGCAGGAAA TCCCGGCCGA CAGCGTACCG 
CTGGATGCCT CCGGCCAGCC CGCAGCGCCC AGCGCGGCGG TGCCGTCGTC GTCCCAACTG 
AATTTCCGCT GGCAGTGA

Protein sequence

MRIARLFVLC FSLLGLPVFA ATVPNLYQVH EPVSSQQPGE RDAGLVRALQ TLLVRLTGNP 
QAPQNPALAG YLKDPQQLIS QYAFENGPPL ALVVDFDPTA TGNALRAAGL PSWGANRPAV 
LAWWLNESAD GSTLVGDNQA SAEPLKRAAQ NRGLPLRLPL ADLDEQIVGT PENLTAAQPD 
ALRAASERYA ADALLAVDAK EADGKWQAQW RLWMGDSREQ GQAEGATPDA LADSVMLAVG 
NRLSTRFVAT PGAATGLTLQ VQGATLARYA ELQRLLDPFG ARLVGVRGDR LDYSVKASPE 
QLRAQLGLAQ LQEIPADSVP LDASGQPAAP SAAVPSSSQL NFRWQ