Gene Pfl01_5040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pfl01_5040
Symbol
ID	3713696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas fluorescens Pf0-1
Kingdom	Bacteria
Replicon accession	NC_007492
Strand	-
Start bp	5676977
End bp	5678083
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	64%
IMG OID
Product	hypothetical protein
Protein accession	YP_350768
Protein GI	77461261
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.763439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00496845
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCCCGA CATCCCGCAG GAAAGTGGTC GTCGCCCATT CGGTTCGGCC CGGCGCACCA 
CAACATGAAG TGCAGACCAA CAAGGCCCTC GCGCGATGGC TGGCGCAGAT CCTCGGCCTC 
AAGTTCGGCG GCAGTTACGA CGCCGAAAAG CATCGCGGCC GGGATATTTA TCTGCTGCCG 
ACCCAGACCC TCGTCGGCGC GGCGGCCCGC GAACTGGGGG TGAGCGGCCC GGACGATTTG 
TGGGGCGGTT TCGTCGAGCA CGATTTCATC TGCACCAAAG CCATCAGCCA CGGTTTGCGC 
AGCCATCAGG CCCATGCGCC GCAAGGCTGG TCGCCCTTGT TTTCCGAGCG GGTGCGCACC 
GTGGTGCTGG ACGGGCTGAG TGTTTTTGCG CTGGAGGATG CACGGCCCGC CGCCGAACAT 
CTGTTGTACA GCGGGCCGAT CCGGATCAAG CCGATTCACG CCTGTGCCGG GCGGGGGCAG 
GAAGTGATCA AGAGCCTGGA TGCGTTCGAC GAAATCCTCG CCCGACCCGA GGCTAGAGAA 
TTGTTCAGCG ATGGCGTGGT GCTGGAGCAG GATTTGAGTC AGGTAGTTAC CCACAGCGTC 
GGCCAGTCGT TCATCGGCGG CAGGGTGCTG AGTTACTGCG GTGATCAATA CTTGACCAAG 
GACGCCCACG GCGAAGAGGT GTACGGCGGC TCGAACCTGC TGGTGGTGCA GGGCGGTTAC 
GAGGATCTGC TGGCGCTGGA TCTGCCCGAC GACGTGCGTC TGGCGATCCA GCAGGCGCAG 
GTGTTCGACC GGGCGGCGGA CGAGGCCTAT CCGCGTTTCT ACGCCTCGCG GCGCAATTAC 
GACATCGCCC AGGGCCTGGA CAGCGAAGGC CGGCCGCGCA GTGGCGTGCT CGAGCAGTCC 
TGGCGCATGG GCGGCGCCAG CAGCGCGGAA GTGGCGGCGC TGCAAAGTTT CGTCAACGAT 
CCTTCGATGC GCGCGATCCG CGTGTCGTCG GTGGAAACCT ATACCGATCA GGCCCTGCCG 
GCGGATGCCA TCGAGGTGTA TCGCGGGCCG GCCGAGAACA GCGACTTTCT CCTCAAATAC 
GTAACGGTCA AATCCTATGA CGGCTAG

Protein sequence

MTPTSRRKVV VAHSVRPGAP QHEVQTNKAL ARWLAQILGL KFGGSYDAEK HRGRDIYLLP 
TQTLVGAAAR ELGVSGPDDL WGGFVEHDFI CTKAISHGLR SHQAHAPQGW SPLFSERVRT 
VVLDGLSVFA LEDARPAAEH LLYSGPIRIK PIHACAGRGQ EVIKSLDAFD EILARPEARE 
LFSDGVVLEQ DLSQVVTHSV GQSFIGGRVL SYCGDQYLTK DAHGEEVYGG SNLLVVQGGY 
EDLLALDLPD DVRLAIQQAQ VFDRAADEAY PRFYASRRNY DIAQGLDSEG RPRSGVLEQS 
WRMGGASSAE VAALQSFVND PSMRAIRVSS VETYTDQALP ADAIEVYRGP AENSDFLLKY 
VTVKSYDG