Gene BURPS1106A_A3062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A3062
Symbol
ID	4905834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2976128
End bp	2977285
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	70%
IMG OID	640146165
Product	hypothetical protein
Protein accession	YP_001077091
Protein GI	126457237
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCGAC AATCCACCAC TGTTCCTTTC GAACTCTCCT CCGCCGAGCT CGCGCGCACG 
CGCGTCGGCA TCGTCGACGG CAAGCGTATC TCGCTCGGCG TGCAAGGCGA CGCGTTGCGC 
GGCTTCGTGC TCGAACGGCG CTGCAAAAGC CCCGGCGAGC CGGTATCGAC GCAGCGCGTC 
GGCCTGCGCG ACCCGGCGGC CGTCGCGGCG TTCGTCGAAC ACGACCCTTA TGTCGTGCAG 
CTCGGAATCG ACTACCGCGC GTTGCTCGAC GTGCACCGCG CAGCGGACGA TGCGGGATCG 
CACGGCGCAT TCGCGGTGCA CGATGCACGG TATGCGCGCC CGGCGAGCGA GGCGGGCGGT 
GCATTCCGCC CAGCGGAGCA CGCCGGTGCC GCGCCGGCCG CCTCCGGTGT GCCCACCGCC 
TCCGCCGCAT CCGTCGCGCA GCCGGAGTTC GCGGTCGAAT GCGAGCACGA CGGCGCGCTG 
CTCGCGCTGA TGCGGCGCAT CTGCGCATCG TGCGGCGCGA CGCAGTGCTT CTATCACTGG 
TTCGTCGTCG ACGAAGACAC GGGGGAGTTC ACGGCGCACG ATCTGCTGAT CGGCGGCGCG 
CCCGCGTGGG CGCAGCGCTA TGTGCATCAG CACTGGTATC TGAACGATCC GGCCGTCGCG 
CACGCGCGCG ACAACACGCA GCCGCTGCGC GGCTCGGCGC TCGCCGAATT GCGCTCCGAT 
CACTGGCTGA ACCGCTACGC GCAGACGCAA GGGCTCGGCA GCAACGTGTT CTTTCCCGCG 
CATCGCCGCG ACGTGTCGAC CTTCGGCTTG CTGCACGTTG CCGCGCCGCT GCCCGCGCCG 
CACGGCGAGG ACGCGCTGTG GCGCAACCGG CGCGTGCTGC GCGGGCTCGC GAACGAGATG 
CTCGAATGGC GCGTCGTGCG GCGGCGCCGC GAGCTCGCGC AGGAGCTGTC GCTCGCCGCG 
CAGGATGTGC TCGCGCTGCG GCTCGTCGCG CGCGGCGGCG GCGCGCGCCA CGTCGCCGAG 
GAACTGCGGC TCGACGAGCG CGCGGTCTAC CAGCTCTTCA CCGCGATCAA CCGCAAGATG 
GACAGCAAGC ACATCAAGAG CAGCGCGACG AAAGCGAAGC GCCTGGGCCT GCTCGCCGAA 
GGCTATATCT CGAAATGA

Protein sequence

MARQSTTVPF ELSSAELART RVGIVDGKRI SLGVQGDALR GFVLERRCKS PGEPVSTQRV 
GLRDPAAVAA FVEHDPYVVQ LGIDYRALLD VHRAADDAGS HGAFAVHDAR YARPASEAGG 
AFRPAEHAGA APAASGVPTA SAASVAQPEF AVECEHDGAL LALMRRICAS CGATQCFYHW 
FVVDEDTGEF TAHDLLIGGA PAWAQRYVHQ HWYLNDPAVA HARDNTQPLR GSALAELRSD 
HWLNRYAQTQ GLGSNVFFPA HRRDVSTFGL LHVAAPLPAP HGEDALWRNR RVLRGLANEM 
LEWRVVRRRR ELAQELSLAA QDVLALRLVA RGGGARHVAE ELRLDERAVY QLFTAINRKM 
DSKHIKSSAT KAKRLGLLAE GYISK