Gene BURPS1106A_A0224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0224
Symbol
ID	4903932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	205454
End bp	207595
Gene Length	2142 bp
Protein Length	713 aa
Translation table	11
GC content	65%
IMG OID	640143331
Product	hypothetical protein
Protein accession	YP_001074267
Protein GI	126456001
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGCGGC AAAGCGGTGA AGCGGCGGAT CGGCGGGATA GCGAAACGAT TCGGCTGAAC 
AACCCGAACG CGGGACGCGG GATGGGGGAC GCCCGGCAGA CGCAACGCGG CGGCAGTGAC 
GTGGCGACCA ATCAACGAGG GCGGCGACGA TTCGTTCGTC GTACTCACCT ATGTCATACC 
CGGCGACTCA TACTGTCGAC GGGGCAGATC GGGAGAGCAT CACTCATGGT CAGGAAACGA 
ATCCGTGCCG TGTTCGCCGC CGCGCTCGTG GGGCTGGCCG CGCACGCGGC GCACGCGCAA 
TACACGACGG ACTGGATCGC GAACACTTAC GGGACCATCG CGTCGCACGT CGGCAACAAC 
GCGCGATCGA TGTGGGTCTC GCCCGAAGGC GTGATCTATA CGGCATCCTT CTGGGACGAA 
AACGCCGGCG GCGTCGCGAT CTATCAGAAC GGCAAGACCC TCGGCTCGAT CGGCACGCAC 
GCCGAATTCC AGGGCGGCGC GATCACCGGC AACGCGACGT CGATCTTCGC GGCGATGCAG 
TACAGCACCC CGCAGGGCAG CGGCACGGTC GGCCGCTACA ACCGCGCGAC GCTGCAGCGC 
GATCTCACGA TCCCGGTCAG CGTGTGGAAC GCGGTCAGCC GAGCCGACGT GATCACCGGC 
CTCGCGACCG CGGGCACGCT GCTGTACGCG AGCGACTACT TCGGCAACCG CGTGCGCGTG 
TTCACCACCG ACGGCGTCTG GCAGCGCGAC ATCGGCATCG CGAACCCCGG CGCGCTCGCG 
CTCGACGATG CCGGCAATCT GTGGGTCGCG CAGAAGAATG CGGCGAAGAT CGTCGAATTC 
AGCCCCACCG GCGCGCTGAT GAACACGATC CAGATGGCGA GCGCGTCGCG GCCGGCTTCG 
CTGTACTTCG ATGCGTCGAA GCGGCAACTG ATGATCGGCG ATCAAGGGCC CGACATGAAC 
ATCAAGCTCT ACGCGATCGC GGGCATGCCG AAGCAGGTCG GCACGTTCGG CGTGCAGGGC 
GGCTATCTCG ACACGACGAC GGGCATCAGG GGCCAAGTCG GCGACCGGCG CTTCACGCGC 
GTGGTCGGCA TCGGCAAGGA TGCCGCCGGC ACGCTGTACG TGCTCAACAA TCCGTGGGGC 
GGCGGCTGGG ACCTCGGGCG CAACGGCGCG ACCGACATTC ACGCGTACGA CGCGCTCGGC 
AACGCGCTGT GGAAGCTGCA GGCGCTGAAC TTCGAGGCGA TCGCCGCGCC GGACCCGACG 
ACCGACGGCG CGCTGTTCTA CAGCGGCATG AACGTCTATT CCGGCACCGC GGGCGGCGCC 
TTCGTCGCGA ACACGGTCGA TCCGTTCACG TACCCGTCCG ATCCACGTCT CGACATGAAC 
GATTATCAGC GCGGCCAGCA TTTCGGCCAG CTCGTGAGCG TCGGCGGCCA CAAGATTCTC 
GTCGCGTCGG GGCAGAATCC GGGCAACTTC AATTTCTATC ACTTCAACGC GGCGAGCGGC 
TACATCGCGA TTCCCGATGC GTCGCTGCCG GGCAAGGGGT TCAACACATC GCTGCAGGTG 
ACGGCCGGCT TTTCGATCGA CAACAAGGGC GACGTGTGGG CGGGCCTCAA TGGAACGAAC 
GCGATCTCGC ACTATCCGCT CGCGGGAATC GATGCGAGCG GCAAGCCATC ATGGGGCGCG 
CCCACCTCGA TCCCGACGCC GGCGAGCGTC CAGCCGACCA CGCGCATTCT CTACCTGTCG 
GACAGCGATA CGATGATCCT CGCGCAGGGC ATCGCGGGAA GCTGGGACTG GACCGCGATG 
AACGGCCGGA TCGAGGTGTA TCACGGCTGG AGCGCGGGCA ACGTCACGCA GCCGAACCCG 
GTGATCGCGC TCACGAGCGC CAATCCGAAA TCGATCGCGT CGGCCGGCAA CTATCTGTTC 
GTCGGGTACG TGCATACGGT GCCGAACATC GACGTGTTCG ATCTCAACAC GGGCCAGCTC 
GTCGCCACGC TGACCAATTC GAACACGGGC ATGATGGACG TGGGCAACGA CGTCGATTCG 
ATGTACGGCC TGAGGGCGTA TCTGCGCTCG ACCGGCGAAT ACGTGATCAC GAAGGACAAC 
TACAACGGAT CGAGCATCGT CGTCTATCGC TGGCGGCCGT GA

Protein sequence

MKRQSGEAAD RRDSETIRLN NPNAGRGMGD ARQTQRGGSD VATNQRGRRR FVRRTHLCHT 
RRLILSTGQI GRASLMVRKR IRAVFAAALV GLAAHAAHAQ YTTDWIANTY GTIASHVGNN 
ARSMWVSPEG VIYTASFWDE NAGGVAIYQN GKTLGSIGTH AEFQGGAITG NATSIFAAMQ 
YSTPQGSGTV GRYNRATLQR DLTIPVSVWN AVSRADVITG LATAGTLLYA SDYFGNRVRV 
FTTDGVWQRD IGIANPGALA LDDAGNLWVA QKNAAKIVEF SPTGALMNTI QMASASRPAS 
LYFDASKRQL MIGDQGPDMN IKLYAIAGMP KQVGTFGVQG GYLDTTTGIR GQVGDRRFTR 
VVGIGKDAAG TLYVLNNPWG GGWDLGRNGA TDIHAYDALG NALWKLQALN FEAIAAPDPT 
TDGALFYSGM NVYSGTAGGA FVANTVDPFT YPSDPRLDMN DYQRGQHFGQ LVSVGGHKIL 
VASGQNPGNF NFYHFNAASG YIAIPDASLP GKGFNTSLQV TAGFSIDNKG DVWAGLNGTN 
AISHYPLAGI DASGKPSWGA PTSIPTPASV QPTTRILYLS DSDTMILAQG IAGSWDWTAM 
NGRIEVYHGW SAGNVTQPNP VIALTSANPK SIASAGNYLF VGYVHTVPNI DVFDLNTGQL 
VATLTNSNTG MMDVGNDVDS MYGLRAYLRS TGEYVITKDN YNGSSIVVYR WRP