Gene BURPS1106A_A2691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2691
Symbol
ID	4905316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2630486
End bp	2631652
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	66%
IMG OID	640145794
Product	hypothetical protein
Protein accession	YP_001076721
Protein GI	126455958
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTGA CACAATCCAT TAGTATTCCT ATCCATTACC CGGCCGCGAC GGCCGCATTG 
CTCTTGCTGC TGCTCACCGG TTGCGGCGGC GGCGGCGACC AGAGCAAGGT CAACGCCGCC 
GCCTCGCCCG CGAACAACCT CGTCGTGCCG GCGCCCGGCA CGGCGTCGCC CGGCACGCCC 
GCGCCCGCGC CCGGCGCGCC GGCGCCCGCC GAGACGGCTT CGGTGCTGCC GTTCTTCGGC 
GTGAACGGCC ATTACGTCGA CGGCGGCGTC TACGCGTCGG TCCCGCTCGC CACGCAGGCA 
AGCCACCTCG CCGGCCTCGG CATGAACGTC TACCGGCAGG ACGTGTACAT TCCGGATCAC 
GTCGACACGC TCGCGTCGAC GGTCATTCCC GGCCTCGGTT CCGGCATCAC GGTCCTGCCG 
ATGATCCAGG CGCATCCATG GGCCGATCCG TCGCTGAACG GCCAACCGCC GACCGAAGCC 
AGCGCGTATG CGTACGCCTA CAAGCTGGCC GCCTACGCGG CGAAGAAGCT CGCCGGCATT 
CCGATGGTGG AGTTCGGCAA CGAGTACGAC ATCGATAGCC ACAACGCGCC GATCCAGGGC 
GACGGCATCA ATGTTTCGGA CTACGACAAT TCCACGTTCC CGATCTGGCG CGGCGCGCTC 
CGAGGCTCGC TCGACGGCTG GCGCTCGGTC GACACGAACC GCACGACGAA GCTGATCGCG 
AACGCAACGT CGGGGGCGCT GCATTTCGGC TTCCTCGACG GCCTGATGAC GGGCACGCAG 
CCCGACGGCA CGACCGGGCA TCCGAAGATC ACGCCCGACG TGATCCAGTG GCACTGGTAT 
TCGAACGGCG GCGATTTCGA GAACGCGCTC GGCAAGACCG GCCGATACAA CGTGCTTGCG 
CGGCTGAAGG ACCGCTACAA CCTGCCGATC GTCGTCACCG AGATCGGCGT GAACACGGAC 
AACTCCGACA CGCAGATCGC CGCGTACATC GCAAAGACGA TCCCCGAGCT GGTTGCGGCG 
AAAGCCGCGT ACAACGTCAT CGGCTTCAAC TGGTATGAGC TTTACGACGA CCGCAGCGGC 
GCTTACGGCT TGCTGACGAA CAGCGCACAG GAAAAGCCCC GTTACGGACT CATGCGCGCG 
GCGATCGCCG GCGCCGTGCC GAACTGA

Protein sequence

MSVTQSISIP IHYPAATAAL LLLLLTGCGG GGDQSKVNAA ASPANNLVVP APGTASPGTP 
APAPGAPAPA ETASVLPFFG VNGHYVDGGV YASVPLATQA SHLAGLGMNV YRQDVYIPDH 
VDTLASTVIP GLGSGITVLP MIQAHPWADP SLNGQPPTEA SAYAYAYKLA AYAAKKLAGI 
PMVEFGNEYD IDSHNAPIQG DGINVSDYDN STFPIWRGAL RGSLDGWRSV DTNRTTKLIA 
NATSGALHFG FLDGLMTGTQ PDGTTGHPKI TPDVIQWHWY SNGGDFENAL GKTGRYNVLA 
RLKDRYNLPI VVTEIGVNTD NSDTQIAAYI AKTIPELVAA KAAYNVIGFN WYELYDDRSG 
AYGLLTNSAQ EKPRYGLMRA AIAGAVPN