Gene PA14_55220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PA14_55220
Symbol
ID	4382550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas aeruginosa UCBPP-PA14
Kingdom	Bacteria
Replicon accession	NC_008463
Strand	+
Start bp	4903681
End bp	4904997
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	71%
IMG OID	639327033
Product	MFS family transporter
Protein accession	YP_792591
Protein GI	116048610
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.872465
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.00000012197
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCTCCC CCACCCGTCC CCCGGCGGCC GCCGATCCGG CCAGCCGCCG CAGCGTCTTT 
GCCGTGGTCC TCGGCAACGC CGTGGAATTC TTCGACTTCG GGGTCTATGC CACCTTCGCG 
GTGATGATCG GACGGACTTT CTTCCCCTCC GACAGCGCCT TCGTCAGCCT GCTCCTGTCG 
GTCACCGCGT TCGGCGTCGG CTTCGTCATC CGCCCCCTCG GCGCGATCCT TATCGGCGCC 
TACGCCGACC GCGCCGGGCG CAAGCCGGCG ATGCTCCTTA CCCTGTTCCT GATGGCGCTG 
GGCACCGGCG GCATCGCGGT GCTCCCCGGC TACGACAGCA TCGGCCCGGC CGCGCCGCTG 
CTGCTGGTGT TGACCCGCCT GCTGCAAGGC CTGGCCTGGG GCGGCGAGGC CGGGCCGGCG 
ACCACCTACA TCCTCGAGGC GGCACCGCCG CACAAGCGCG GCACCTACGC CTGCTGGCAG 
GTCGTGGCGC AAGGCATCGC GGCGGTCGCC GCCGGGCTGA TGGGCTACCT GCTCACCCTC 
TGGCTCGACG AGCGCCAACT GCAGGAATGG GGCTGGCGGA TTCCCTTCGC GGCCGGCCTG 
CTGGTCCTGC CGATCGGCCT GTACATCCGC CTCAACCTGG CCGAGACCTT TTCCGGACGC 
GGCCGCCAGG CCAGCACCCG GAACCTGCTC GGCGAGTTGT TCGGCAATCA TCGGCGGGCC 
CTGCTGCTCG GCCTGCTGAT CCTCTCCGGA AGCACCATCA CCCAGTACTT CCTCAACTAC 
ATGACCACCT TCGCCCTTAC CGAGCTACAC CTGCCGGCGG GCATCGCGAT GCTCTCGACG 
CTGGTCGCCG GCGCCGCACT GGCGCTCTCG GCGTTGCTCG GCGGCGTGCT CTGCGACCGC 
TACGGGCGCC GCGCCGTGCT GATCCTGCCG CGCCTGGCGC TGCTCGCGGT GCTGTTCCCG 
GCACTGCAGG CAATGACCCG TCACCCCGAG CCGGCAGTCT TCCTCGCCGT CCTCGCCCTG 
CTCTCGGCCC TGCATGGCAT GAGCGGCGCG GCGCTGATCG TGCTACTGGT AGAAAGCTTC 
CCGCGGGCGC TGCGCTCCAC CGGTTTTTCC CTGGTCTATG CGACCGGCGT CGCCGCGTTC 
GGCGGCACCG CGCAGATCGT GGTGACCTGG CTGATCGGCG TCACCGGCAA TCCGCTGTCG 
CCGCTGGGCT ACCTGCTGCT GGCCAACCTG GTCTGCCTGG TTGGGGCCTG GCTGGCCCGC 
GAGACCTGGC CGGGTCGCGG GGACATGGGA GGCGCGCCGC TGGTGCTGCG CGACTGA

Protein sequence

MRSPTRPPAA ADPASRRSVF AVVLGNAVEF FDFGVYATFA VMIGRTFFPS DSAFVSLLLS 
VTAFGVGFVI RPLGAILIGA YADRAGRKPA MLLTLFLMAL GTGGIAVLPG YDSIGPAAPL 
LLVLTRLLQG LAWGGEAGPA TTYILEAAPP HKRGTYACWQ VVAQGIAAVA AGLMGYLLTL 
WLDERQLQEW GWRIPFAAGL LVLPIGLYIR LNLAETFSGR GRQASTRNLL GELFGNHRRA 
LLLGLLILSG STITQYFLNY MTTFALTELH LPAGIAMLST LVAGAALALS ALLGGVLCDR 
YGRRAVLILP RLALLAVLFP ALQAMTRHPE PAVFLAVLAL LSALHGMSGA ALIVLLVESF 
PRALRSTGFS LVYATGVAAF GGTAQIVVTW LIGVTGNPLS PLGYLLLANL VCLVGAWLAR 
ETWPGRGDMG GAPLVLRD