Gene Bphyt_3754 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bphyt_3754
Symbol
ID	6282020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia phytofirmans PsJN
Kingdom	Bacteria
Replicon accession	NC_010681
Strand	-
Start bp	4201727
End bp	4203355
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	60%
IMG OID	642623341
Product	extracellular solute-binding protein family 5
Protein accession	YP_001897366
Protein GI	187925724
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID	[TIGR03159] CRISPR-associated protein Csc1

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.884226
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAAA ACAATCTGTT GCGCGCCGCG CGTGTTACGA CGCTCGTCGC AGCTGCAGCG 
GCATCGATGG TGGGCGCAAG TGTCGCGCGC GCCGAGATTC CGAATAAAAC CCTGGTCTAC 
TGCTCAGAAG GCAGCCCTGC GGGTTTTGAT CCTGCCCAAT ACACCACGGG CACCGATTTC 
ACGGCCAATA CGTTCACCGT CTACAACCGT CTCGTCGAAT TCGAACGCGG CGGCACCAAG 
GTCGAACCGG GCCTTGCGGA AAAGTGGGAT GTGTCCGCGG ACGGCAAGAC GTACACGTTC 
CATCTGCGTC ATGGCGTGAA GTTCCAGACC ACCTCGTTCT TCAAGCCGAC GCGCGAATTC 
AACGCGGACG ACGTCGTGTT CACGTTCCAG CGCATGCTGG ACCCGAACTC GGCCTTTCAT 
AAGGCTTACC CGGTCCAGTT CCCGTACTTC ACGGACATGG GCCTCGACAA GCTGATCACC 
GGCGTCGAAA AGGTCGATCC GTACACGGTC AAGTTCACGC TGAAGGAAGT CAACGCGCCG 
TTCATCCAGA ATCTGGCAAT GGAATACGCG TCGATCCTGT CGAGCGAATA CGGCGACCAG 
TTGATGAAAG CCGGCAAGGC CGCCGACATC AACCAGTTCC CGGTCGGCAC GGGCCCGTTC 
ATTTTCAAGA GCTACACGAA AGATGCAACG ATCCGCTTCG ACGGCAATCC GGATTACTGG 
AAGCCGAACA CGGTGAAGAT CTCGAAGCTG ATCTTCTCGA TCACGCCGGA CGCCGGCGTG 
CGCGTGCAGA AGATCAAGCG CGACGAATGC CAGGTGATGA GCTATCCGCG TCCGGCCGAT 
ATCGCGCCGC TGAAGGCTGA AGCGAACATC GCAATGCCGT CGCAACCGGG CTTCAACCTC 
GGCTACCTCG CGTACAACGT GTCGCACAAG CCGGTCGACA AGGTCGAAGT GCGTCAGGCG 
CTCGACATGG CGATCAACAA GAAGGCGATC ATCGACTCCG TGTACCAGGG CGCAGGCCAG 
GCCGCCACGA ATCCGATGCC GCCGACCCAA TGGTCGTACG ACAAGAACCT GAAGGGCGCG 
GCCTACGATA CGGACAAGGC CAAGGCGCTG CTGGCCAAGG CTGGCTATCC GAACGGCTTT 
GACATCACGC TGTGGGCGAT GCCGGTGCAA CGCGCCTACA ACCCGAACGC CCGCCTGATG 
GCGGAAATGA TCCAGGCCGA TTGGGCCAAG ATCGGCGTGA AGGCGAAGAT CGTCACGTAT 
GAGTGGGGCG AGTACATCAA GCGCGCTCAC GCAGGTGAGG ACGACACGAT GCTGATCGGC 
TGGACCGGCG ACAACGGCGA TCCGGACAAT TGGCTCGGCA CGCTGCTCGG CTGCGAAGCG 
GTGAACGGCA ACAACTTCTC GAAGTGGTGC TACAAGCCGT TCGACGACCT GATCCAGAAG 
GGCCGCGTCA CGTCCGATCA GGGCGCGCGC ACGACGGCTT ACATGCAGGC GCAGCAGATC 
TTCGCGCAGC AACTGCCGTT CTCGCCGATC GCTCACTCCA CGGTCTACCA GCCTGTCAGC 
AAGAAGGTGG TGGATATGCG TATCGAACCG CTCGGCTATG CGCGTTTCGA CGGCGTCAGC 
ATCAAGTAA

Protein sequence

MKQNNLLRAA RVTTLVAAAA ASMVGASVAR AEIPNKTLVY CSEGSPAGFD PAQYTTGTDF 
TANTFTVYNR LVEFERGGTK VEPGLAEKWD VSADGKTYTF HLRHGVKFQT TSFFKPTREF 
NADDVVFTFQ RMLDPNSAFH KAYPVQFPYF TDMGLDKLIT GVEKVDPYTV KFTLKEVNAP 
FIQNLAMEYA SILSSEYGDQ LMKAGKAADI NQFPVGTGPF IFKSYTKDAT IRFDGNPDYW 
KPNTVKISKL IFSITPDAGV RVQKIKRDEC QVMSYPRPAD IAPLKAEANI AMPSQPGFNL 
GYLAYNVSHK PVDKVEVRQA LDMAINKKAI IDSVYQGAGQ AATNPMPPTQ WSYDKNLKGA 
AYDTDKAKAL LAKAGYPNGF DITLWAMPVQ RAYNPNARLM AEMIQADWAK IGVKAKIVTY 
EWGEYIKRAH AGEDDTMLIG WTGDNGDPDN WLGTLLGCEA VNGNNFSKWC YKPFDDLIQK 
GRVTSDQGAR TTAYMQAQQI FAQQLPFSPI AHSTVYQPVS KKVVDMRIEP LGYARFDGVS 
IK