Gene BURPS1106A_4001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_4001
Symbol
ID	4899584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3903571
End bp	3904689
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	71%
IMG OID	640137227
Product	hypothetical protein
Protein accession	YP_001068220
Protein GI	126452219
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGCGTC AGACGTTTCC GGGCCGCGCG CAGGCGCTGC GGCAGCGCTT GAGCGCGCTC 
GCGCCGGCGC TCGTCGCCGC CGCCGCGCTG GCGGCGGCCG GCCCCGCGCG CGCGGCGATG 
AATTTTTGCG CCGCGCCGGC GCTGCAAAGC AGCGAGGCGA CGCATGCCGA ACCGGGCGTG 
CAGGCGCTCA TCAAGAGCGT CGATGCGCAT CTGAACGATG AGCCGAAGGC GCTGCCGCGC 
GTGCACACCG AGGGCACGCT GCCGCACGAG GGCATTTACG ACCAGAGCGC CGAGGCGCTC 
AACGACATGG AGCTGATGCG CAACGCGGCG CTCGCGTGGC GCGTGACGAA CCAGAGCCGC 
TATCTGGCGC TCGTCGACCG CTTTCTGTCG ACGTGGGTGA ACACTTACCG CCCGAGCTTC 
AATCCGATCG ACGAAACGCG CTTCGAGAGC CTGATCCTCG CGTACGACAT GACGGCGAGC 
GCGCTGCCCG TGAAGACGCG CAACGCGGCG GCCGCGTTCA TCGCGGCGCT CGGCAACGGC 
TACGTGCAAC AGATCGATGC GCAGAAGCGC CCGCTCAAGG GCACGTGGCG CAACAACTGG 
CAGAGCCACC GGATCAAGCT GATCGCGCTC GCCGCGTTCA CGCTCGGCGA CCGTAGGATG 
ATGAACGCCG CGCAGCGGCT TTTCGTCGAG CATCTCGCCG ACAACATCGA GCCCGACGGC 
ACGACGTACG ATTTTCTCGA GCGCGACGCG CTGCACTACG CGGTCTACGA TCTGCAGCCG 
CTCGCGACGG CCGCGCTCGC CGCGCGGCGC TTCAACCGCA ACTGGCTGCG CGAGCGCGCG 
CCGAACGGCG CGACGCTCGC CGCCGCGCTC GACTGGCTCG CGCCGTACGC GCGCGGCGAG 
AAGACGCACG AGGAGTTCGT CCACTCGCCC GTGCCGTTCG ACGCGAAGCG CCGCGAGGCG 
GGCCTGCCCG GCTATTCCGG CATGTGGGAG CCGAAGAACG CGACCGAGCT GTTCCATCTC 
GCCGCGCGCC TGGACGGCCG CTACGCGGGC ATCGCCCAAC AACTGTCGCC GATGCCGCCG 
GCGTGGCTGG CCGCGTGCCT GCCGCTGCCG GCGCGGTGA

Protein sequence

MVRQTFPGRA QALRQRLSAL APALVAAAAL AAAGPARAAM NFCAAPALQS SEATHAEPGV 
QALIKSVDAH LNDEPKALPR VHTEGTLPHE GIYDQSAEAL NDMELMRNAA LAWRVTNQSR 
YLALVDRFLS TWVNTYRPSF NPIDETRFES LILAYDMTAS ALPVKTRNAA AAFIAALGNG 
YVQQIDAQKR PLKGTWRNNW QSHRIKLIAL AAFTLGDRRM MNAAQRLFVE HLADNIEPDG 
TTYDFLERDA LHYAVYDLQP LATAALAARR FNRNWLRERA PNGATLAAAL DWLAPYARGE 
KTHEEFVHSP VPFDAKRREA GLPGYSGMWE PKNATELFHL AARLDGRYAG IAQQLSPMPP 
AWLAACLPLP AR