Gene Pfl01_5240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pfl01_5240
Symbol
ID	3716191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas fluorescens Pf0-1
Kingdom	Bacteria
Replicon accession	NC_007492
Strand	+
Start bp	5895992
End bp	5897170
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	60%
IMG OID
Product	glycine betaine/L-proline transport ATP-binding subunit
Protein accession	YP_350968
Protein GI	77461461
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0848067
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.021429
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATAA TTCGCTTCGA TAACGTTGAC GTGATCTTCA CCAAGGATCC GCGCGAAGCA 
CTGAAACTTC TCGATCAAGG CCTGACCCGC AGTGAAATCC TGAAAAAGAC CGGGCAGATC 
GTCGGCGTTG AAAAGGCCAG CCTGGACATC AACAAAGGCG AGATCTGCGT GCTGATGGGC 
CTCTCCGGCT CCGGCAAGTC GAGCCTGCTG CGCTGCATCA ACGGCCTCAA CACCGTGAGC 
CGCGGCAAGC TGTTCGTCGA ACATGAAGGC AAGCAGATCG ACATCGCCTC CTGCTCCCCG 
GCCGAGCTGA AAATGATGCG CACCAAACGC ATCGCCATGG TGTTCCAGAA GTTCGCCCTG 
ATGCCCTGGC TGACGGTGCG CGAGAACATC AGTTTCGGTC TGGAAATGCA GGGTCGTCCG 
GAGAAGGAAC GGCGCAAACT GGTCGATGAC AAACTCGAAC TGGTGGGCCT GACCCAATGG 
CGCAACAAGA AGCCCGACGA GCTGTCCGGC GGCATGCAGC AGCGTGTCGG CCTGGCCCGC 
GCGCTGGCGA TGGACGCCGA CATTCTGCTG ATGGACGAAC CGTTCTCGGC CCTCGACCCG 
CTGATCCGTC AGGGCCTGCA GGATGAACTG CTGGAACTGC AACGCAAGCT GAGCAAGACC 
ATCGTGTTCG TGAGCCACGA CCTCGACGAG GCGCTGAAAC TCGGCAGCCG CATCGCGATC 
ATGAAAGACG GCCGGATCAT CCAGTACAGC GTGCCGGAAG AGATCGTGCT CAATCCTGCG 
GACGATTACG TGCGCACCTT CGTCGCCCAC ACCAACCCGC TGAACGTGCT GTGCGGTCGC 
AGCCTGATGC GCACCCTGGA CAACTGCAAA CGCATCAACG GTTCGGTATG TCTGGATCCG 
GGCGGCGATT CGTGGCTGGA CCTGGCCGAA GGCAACACCA TCAAGGGTGC GCGGCAGAAC 
GGTTCGGTGC TGAACCTGCA GAACTGGGCA CCGGGGCAAG CCGTGGAAGG GCTGGAGCGC 
AAACCGACGC TGGTGGACTC GAACATCGGC ATGCGCGACG CGTTGCAGAT CCGATACCAG 
ACCGGCAACA AACTGGTGCT GCACGACAAC AACCATGTGG TGGGGATTCT TGGGGACAGC 
GAGCTGTATC ACGCGTTGCT CGGGAAGAAC CTAGGGTAA

Protein sequence

MSIIRFDNVD VIFTKDPREA LKLLDQGLTR SEILKKTGQI VGVEKASLDI NKGEICVLMG 
LSGSGKSSLL RCINGLNTVS RGKLFVEHEG KQIDIASCSP AELKMMRTKR IAMVFQKFAL 
MPWLTVRENI SFGLEMQGRP EKERRKLVDD KLELVGLTQW RNKKPDELSG GMQQRVGLAR 
ALAMDADILL MDEPFSALDP LIRQGLQDEL LELQRKLSKT IVFVSHDLDE ALKLGSRIAI 
MKDGRIIQYS VPEEIVLNPA DDYVRTFVAH TNPLNVLCGR SLMRTLDNCK RINGSVCLDP 
GGDSWLDLAE GNTIKGARQN GSVLNLQNWA PGQAVEGLER KPTLVDSNIG MRDALQIRYQ 
TGNKLVLHDN NHVVGILGDS ELYHALLGKN LG