Gene BURPS1106A_3104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3104
Symbol
ID	4902320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3025257
End bp	3026885
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	71%
IMG OID	640136330
Product	putative amino acid ABC transporter, permease protein
Protein accession	YP_001067342
Protein GI	226830772
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0559] Branched-chain amino acid ABC-type transport system, permease components
TIGRFAM ID	[TIGR03409] urea ABC transporter, permease protein UrtB

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCATGC CTTTGAGCCG CGCCGCTCGT GCGCTCGCGG CGCTCGCCGC CTGCGCGGCG 
TTTTCGTTCG CCGCGCCGCG TGCGGCGCTC GCCGTCACGG CGGCCGACGT CGCCGCGCTC 
GCCGGCGACG ACTTCGATGC GAAGCGCGCC GCGATCGACC GTCTCGCCGC CGGGCACGAC 
GCCGCCGCGG CCGCGCTGCT GAACGCGCTC GCGAACGGCG ACGCGCTCGC GACCGACGCC 
GGGCGCATCC TGATTCAGCA TGGCGACGCC GCGCGCGACG CACTGACGAA CGCGCCCGCG 
CAGGCGGGCG ATGCGCAGCC GGTGATGCTC AACAACCTGC TGCGCGCGAA GATCGCGAAC 
GCACTGTCGG GGCTCGATCT CGCGTCGCCC GACATCGACA CGCGCCGCCG CGCGATCGAT 
GCGCTGCTCA AGCGCCCCGA TGCCGCGCTC AAGCCGATGA TCGACGCCGC GCGTGCGAAG 
GAAACCGATC CCGTGCTCAA GCGCCGCCTC GACGCGCTAT GGGCGATCGC CGCGCTGCGC 
GACGCCGATC CCGCGAAGCG CCTCGAAGCG GTGCGGCTCG TCGCCGCGCG AAGCGATCTC 
GACATGATCG AGCAACTGCG CCCGCTCGTC GCGAAGCGGC CCGACGGCGG CGACGCGGAA 
CCCGATGCGC GCGTGCGCGA GGCCGCGCAG CAGGGGCTCG GCGCGCTCTA TGCGATCCAG 
CGCCGCGGCG AAATCGCGGG CACGCTGTTC GCGGGGCTCT CGCTCGGCAG CGTGCTGCTG 
CTCGCCGCGC TCGGCCTCGC GATCACGTAC GGCCTCATCG GCGTCATCAA CATGGCGCAC 
GGCGAGTTCC TGATGATCGG CGCGTATGCG ACCTACGTCG TGCAGACGCT CGTGCAGCGC 
TATCTGCCCG GCGCGTTCGA CTGGTATCCG CTCGCCGCGA TTCCCGTGTC GTTCGCCGCG 
GCCGCCGCGC TCGGCATCGT GCTCGAGCGC ACGGTGCTCA GGCACCTGTA TGGCCGCCCG 
CTCGAGACGC TGCTCGCGAC GTTCGGCGTG AGCCTCATCC TGATCCAGGC GACGCGGATG 
ATCTTCGGCG CACAGAACGT GCAGGTCGTC AATCCGTCGT GGATGAGCGG CGGCGTGACC 
GTGATGCAGA ACCTGATCCT GCCGTACAAC CGCCTCGCGA TCCTCGCGTT CGCGCTCGTC 
GTCGTCGGCA TCGCGTGGGC CGTGCTGACG AAAACGCGCC TCGGCCTGTT CGTGCGCGCG 
GTCACGCAGA ACCGCCGGAT GGCCGCGTGC GTCGGCGTGA AGACGGCGCG CGTCGATTCG 
TATGCGTTCG CGTTCGGCGC GGGCATCGCG GGCCTCGGCG GCTGCGCGCT GTCGCAGATC 
GGCAACGTCG GCCCGGATCT CGGCCAGAGC TACATCGTCG ATTCGTTCAT GGCGGTCGTG 
CTGGGCGGCG TCGGCCAGAT CGCGGGCACG GTGCTCGGGG GCTTCGGCCT CGGGCTCGTC 
AGCAAGGCGA TCGAGCCGTT CTGGGGCGCG GTGCTCGCGA AGATCGCCGT GCTCGTGATG 
ATCGTGCTGT TCATCCAGAA ACGCCCGCAA GGGATGTTCG CCCTGAAGGG CCGCAGCGCG 
GAGGCATGA

Protein sequence

MPMPLSRAAR ALAALAACAA FSFAAPRAAL AVTAADVAAL AGDDFDAKRA AIDRLAAGHD 
AAAAALLNAL ANGDALATDA GRILIQHGDA ARDALTNAPA QAGDAQPVML NNLLRAKIAN 
ALSGLDLASP DIDTRRRAID ALLKRPDAAL KPMIDAARAK ETDPVLKRRL DALWAIAALR 
DADPAKRLEA VRLVAARSDL DMIEQLRPLV AKRPDGGDAE PDARVREAAQ QGLGALYAIQ 
RRGEIAGTLF AGLSLGSVLL LAALGLAITY GLIGVINMAH GEFLMIGAYA TYVVQTLVQR 
YLPGAFDWYP LAAIPVSFAA AAALGIVLER TVLRHLYGRP LETLLATFGV SLILIQATRM 
IFGAQNVQVV NPSWMSGGVT VMQNLILPYN RLAILAFALV VVGIAWAVLT KTRLGLFVRA 
VTQNRRMAAC VGVKTARVDS YAFAFGAGIA GLGGCALSQI GNVGPDLGQS YIVDSFMAVV 
LGGVGQIAGT VLGGFGLGLV SKAIEPFWGA VLAKIAVLVM IVLFIQKRPQ GMFALKGRSA 
EA