Gene BURPS1106A_A1203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1203
Symbol
ID	4903555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1144855
End bp	1146345
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	69%
IMG OID	640144309
Product	amino acid permease
Protein accession	YP_001075238
Protein GI	126457600
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID	[TIGR01297] cation diffusion facilitator family transporter

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.439752
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGATT GGTCGGGTTA TTCGAATGCG GCGGCCGGAT CGGCGGCGGT CGGCGCGGGC 
GGGCGGCCCG CGCTGGCGGC GGGCGCGGTG GGCTTTCCGA CGGCGCTCGC GAGCGCCGTC 
GGCCTCATCA TGGCGAGCCC GGTGATCCTG ACCGCGACGT CCGGCTTCGG GATGGGCGGC 
TGGGCGTTCG CGGCCGCGAT GCTCATCGCG TTCGTGATGA TGCAGGCGCA GGCGACGACG 
TTTGCCGAGG CGGCGGCGAT GCTGCCGACG GCGGGCTCCG TCTACGACTA CCTGTCGTGC 
GGGCTCGGCC GCTTCTGGGC GATCACGGGC ACGATCTCCG CGTACTTTCT CGTTCACGTG 
TTCGCCGGCA CGGCGGAGAC GATCCTGAGC GGCATCATGG CGCTCGTGAA CTTCGAATCG 
CTGAACGCGG CGTTCGAGCG GCACGACAGC GCATGGCTCG TCGGCGTCGG CCTCGTCGTG 
ACGTTCGCGT TCACCAACAT CATCGGTATC AAGGTGTTCA GCAAGCTCGA GATCGTGTTG 
ACGGTCGGCA TGTGGCTGTC GCTGACGATT TTCGGCGTGC TCGGGCTCGT CGCCGCGCCC 
GCCGTGCAGC TCGACGGCTG GTTCGGGCGC TCGGAGATCG GCGCGTCCGC GCCCGCCGTG 
CTGTCGCTCG TCGGGATGGC GATGTTCATG TTCGTCGGCT GCGAGTTCGT CACGCCGCTC 
GCGCCGGAAA TGAAAACGCC CGGCAAGACG ATTCCGCGCG CGATGGCGCT CGGGCTCGCG 
GGCGTCGCGG TCTGCATGTT CGTCTACGGC GCGGCGATCA AGCGGCAGGT GTCGAACGTC 
GCGGTGACGG CGGACGGCCT CACGCATCTG CTCGACACGC CCGGCGCGAT TCCCGCGTTC 
GCGTTGCAGG TGCTCGGCCC GTTCGGGCGG GCATGGTTCG GCATCGCGTT CCTGTGCGCC 
GGCGCGGCGA CGATCAACAC GCTGATGGCC GGCCTGCCGC GGATCCTGTA CGGCATGGCC 
ATCGACGGCG CGCTGCCGAA ATGCTTCGCG TACCTGCATC CGCGCTTTCG CACGCCGGTC 
GTCGGCATCG TCGCGGCGGC CGTCGTGCCG ATCGCGCACG CGTGGATCAT CCACGGCGAT 
CTCGGCAGCA TCATGCACCT CGTGCTCGCC GCGACCTGCG CGTGGGGCAC CGCGTACCTG 
CTCGTCACGC TGTCCGTCGT GATGCTCAGG ATTCGCCGCC CGGATCTGCC GCGGCCGTAC 
CGGTCGCCCT GGTTTCCGCT GCCGCAGATC GTGTCGAGCG TCGGCATCGT GCTCGCGATC 
TGGTATATCG CGCCGCCGGG GACGAACAGC CGCGACATCT ACGTGCCGTT CGGCGCGATG 
CTCGGGCTCA CCGCGCTCTA TGCGCTGTTC TGGACGATCG TCGTGCAGCG CAAGCATCCG 
TTCCGGCCGG TGCCGGTTGA AGAGGTGCTG CGCAACGAGT GCGTGCGATG A

Protein sequence

MADWSGYSNA AAGSAAVGAG GRPALAAGAV GFPTALASAV GLIMASPVIL TATSGFGMGG 
WAFAAAMLIA FVMMQAQATT FAEAAAMLPT AGSVYDYLSC GLGRFWAITG TISAYFLVHV 
FAGTAETILS GIMALVNFES LNAAFERHDS AWLVGVGLVV TFAFTNIIGI KVFSKLEIVL 
TVGMWLSLTI FGVLGLVAAP AVQLDGWFGR SEIGASAPAV LSLVGMAMFM FVGCEFVTPL 
APEMKTPGKT IPRAMALGLA GVAVCMFVYG AAIKRQVSNV AVTADGLTHL LDTPGAIPAF 
ALQVLGPFGR AWFGIAFLCA GAATINTLMA GLPRILYGMA IDGALPKCFA YLHPRFRTPV 
VGIVAAAVVP IAHAWIIHGD LGSIMHLVLA ATCAWGTAYL LVTLSVVMLR IRRPDLPRPY 
RSPWFPLPQI VSSVGIVLAI WYIAPPGTNS RDIYVPFGAM LGLTALYALF WTIVVQRKHP 
FRPVPVEEVL RNECVR