Gene BURPS1106A_A0487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0487
Symbol	phnS
ID	4904629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	477213
End bp	478295
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	66%
IMG OID	640143593
Product	2-aminoethylphosphonate ABC transporter, periplasmic 2-aminoethylphosphonate-binding protein
Protein accession	YP_001074529
Protein GI	126456762
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID	[TIGR03227] 2-aminoethylphosphonate ABC transporter, periplasmic 2-aminoethylphosphonate binding protein

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTATA CGAATTTCCC GCGCGGCGGC GCCTGGCGCC GCTTCGCGCT CGCCGCCGGC 
GCCGCCGCGC TGTTGCAAGG CGCGGCAGCG CAGGCGCAGG CGGCAGCCGT CGTGCTGTAC 
ACGGCGGACG GCCTCGAGAA CCTGTACCGC GACGTGCTGC CCGCGTTCGA GAAGCAGGAA 
GGCGTGAAGG TGAACATCGT GACGGCGGGC AGCGGCGAAG TGGTGAACCG CGCGAACGTC 
GAGAAGGGCT CGCCGAAGGC CGACGTGATC GTCACGCTGC CGCCGTTCAT TCAGCAGGCC 
GGCCAGTTCG GCCTGCTGCA GCCGTACCGC AGCGTCAACT ACAAGAACGT GCCGGCGATC 
GCGAAGGCGG AAGACGGCTC ATGGGCGACG TTCGTCAACA ACTACTTCTC GTTCGCGATC 
AACCCGTCGG TCGTGAAGAG CCAGCCGAAG ACGTTCGCCG ATCTGCTGCA TCCCGATTAC 
AGCGGCAAGC TCGCGTATTC GAACCCGGCG ACGGCGGGCG ACGGGATGGC CGTCATCATC 
CTGACGAGCG CGCTGATGGG CGAGGACAAG GCGTTCGACT ATCTCGCGAA GCTCGAGCGC 
AGCGTGAAGT TCCACACGAA GGGCACGGGC TACCTGAACG TGCTGCTGTC GCGCAACGAG 
ATCGCGGTCG CGAACGGCGA TCTGCAGATG GATCTGGACG ACGCCGAGCA CGGCGGCCTG 
TCGATCAAGC CGATCTTCGT CGCCGCGAAG GCGGGCGAGC CGCCGACGAC GTTCCAGTTG 
CCGTACGCGA TCGGCCTCGT CAAGGGCGGC CCGAACCAGG ACGCGGGCAG GAAGCTGATC 
GACTACCTGA TGTCGGCCGA CGTGCAGGCG AAGGTGCCCG ACATGTTCGG CATTCCGGGC 
CGCACCGACG TGCCGCTTTC GGGCAAGAAC GGCGAGGCGG TGAAGCGCGC GATCGCCGGC 
GTGAAGCTGA TTCCGGTCGA CTGGGACGCG GTGATGGCGA AGAAGCCCGT GTGGACCGAG 
CGCTGGAAGA AGGAAGTGAT CGGCGATTCG GGCAAGCAGA CCGAAGTCGT CAAGCCGAAA 
TGA

Protein sequence

MTYTNFPRGG AWRRFALAAG AAALLQGAAA QAQAAAVVLY TADGLENLYR DVLPAFEKQE 
GVKVNIVTAG SGEVVNRANV EKGSPKADVI VTLPPFIQQA GQFGLLQPYR SVNYKNVPAI 
AKAEDGSWAT FVNNYFSFAI NPSVVKSQPK TFADLLHPDY SGKLAYSNPA TAGDGMAVII 
LTSALMGEDK AFDYLAKLER SVKFHTKGTG YLNVLLSRNE IAVANGDLQM DLDDAEHGGL 
SIKPIFVAAK AGEPPTTFQL PYAIGLVKGG PNQDAGRKLI DYLMSADVQA KVPDMFGIPG 
RTDVPLSGKN GEAVKRAIAG VKLIPVDWDA VMAKKPVWTE RWKKEVIGDS GKQTEVVKPK