Gene BURPS1106A_A0098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0098
Symbol
ID	4903539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	86047
End bp	87078
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	54%
IMG OID	640143205
Product	ABC transport system, exported substrate-binding protein
Protein accession	YP_001074141
Protein GI	126456143
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG TAGTCGGAGC GATGCTGCTG CTTGCTGTCG GTCATGCTGT CTCAGCCGAA 
CTCCATATCG GAAGCTGGCC GGATTACCTG CCCGATACGC TGATCAAGAA GTTCCAGGCG 
GAAACCGGCA TCAAGACAAC GCTCGACACC TACGCGAGCG ATGCGGCCCT CACTCAAAAG 
TTGCAGTCGG GCGGAGGTGG CTACGACGTT GTGATCGCAG GGGACTATTA CGTTCCGGTG 
CTTGTGAAGT CTGGATTGCT GCAGAAGCTC GACAAGAACA AGCTGCCGAA TATCGCCAAC 
ATCAAACCCG AGTATCGCCA TCCGTCATTC GATCCGCAAC GGGATTATGC GATGCCATAC 
ACCGTCGTGC TGACTGGTTT CGCGTACGAT AGCGCGCGCG TTTCCGGAGG GAAACTCGAC 
GAGAGTTGGA AGTCGTTCTT CGATCCGCCA GCGCAGTTGC GCGGACAGAT CGGCGACCTG 
GATGTCGAAG AGGAGCTGTA TATGGCCGCG AGTTGGTATC TGGGACAGGA TGAATGCACA 
GAAAATCCTG CTGATGCGAA GCGGGTGCTC GACGTTTTGC AAAAACAGAA ACCGTTCGTG 
AAAACGTACA GCAATGACGG AACCATAGAT CGTCTCGCGT CCAAGCAGAT CGCGGTGCAG 
CATATTTGGA GCGGTGCCGC TGCGCGTGCA CAGGACCGTC TTCCCAGCAT CACCTTTGTA 
TACCCGAGGG AAGGCGTCCG TCTGTTCATG GATAGCTTGC TTATTCCGGC AAAGGCACAA 
AACACCGCCT CGGCATATCA ATTCGTTAAC TGGATGATGC GCCCGGAGAA CATTGCGCAG 
GTTACAAATG CCGTTCGCTA CAACAACGAG ATCATCGGCT CCGAGCGGTA TATCGATGCC 
GCACTGTTGA AAAACTCCGC GATAAAAACC CCGGAGCAAT ACAAAATAAG GCTCCGTCCT 
TACAAAATAT GTTCGCCGGC GGCGATTCAG TTACGAAACA AAGTCTGGCT AAAGTTGAAG 
GGAAATCGCT GA

Protein sequence

MKKVVGAMLL LAVGHAVSAE LHIGSWPDYL PDTLIKKFQA ETGIKTTLDT YASDAALTQK 
LQSGGGGYDV VIAGDYYVPV LVKSGLLQKL DKNKLPNIAN IKPEYRHPSF DPQRDYAMPY 
TVVLTGFAYD SARVSGGKLD ESWKSFFDPP AQLRGQIGDL DVEEELYMAA SWYLGQDECT 
ENPADAKRVL DVLQKQKPFV KTYSNDGTID RLASKQIAVQ HIWSGAAARA QDRLPSITFV 
YPREGVRLFM DSLLIPAKAQ NTASAYQFVN WMMRPENIAQ VTNAVRYNNE IIGSERYIDA 
ALLKNSAIKT PEQYKIRLRP YKICSPAAIQ LRNKVWLKLK GNR