Gene BURPS668_A1083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1083
Symbol
ID	4887051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	1043282
End bp	1044607
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	76%
IMG OID	640131023
Product	hypothetical protein
Protein accession	YP_001062082
Protein GI	126444567
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGATGA GATTTCACCT CGTCCGCCGC CTGGGCCGTG CGGCATCGTT CGCGATCGGG 
CCGATGGCCT CGCTGCTGTT CGTCGCCCAC GGCGCCGCCG GCGCCGAGCC GCCGCGCGCG 
GCGCTGCTCG CGGCCGGATG CAAGACGCTC GCCGAGCGCG TGCACGCGCC CCCCGGCTCG 
GGGCCCGTCT TTCTCGGCAG CTACGAGCCC GCGCCCGGCG GCGCGGCGCT CGCGGGCGCG 
CTGACGCAGG CCGCGTTCGT CTATGACAAC GCGCTCGCGA GCATCGCGCT CATCGCCTGC 
CACCGCCCCG GCGACGCGCG CCGCATCGCC GACGCGATCC TGCAGGCGAG CCGGCAGGAT 
CGCCACTACC GCGACGCGCG CGTGCGCAAC GCGTACCGCG CGGGTGCGCT GCCGCCGGGG 
CCCGCACCGC TGCCCGGCTG GTGGGACACG CCGAGCAAGC GCTGGTTCGA GGACGCCTAT 
CAGGCGGGCA CCGCGACCGG CAACGTCGCG TGGGCCGCGC TGTCGCTGCT CGCCGTGTAC 
GAAGCGACGC GCGAGCGGCG CTATCTCGAC GGCGCCGCCG CGCTGATGGG CTGGGTCGAC 
CCCGGCCGGC TCGACGCGAC GGCGCCGGCC GGCTACGTCG GCGGCGAGTT CGGCCATGAG 
CCGCAGCCGC TCCGCCAGGG CTGGAAATCC ACCGAGCACA ACGTCGATGC GTACGCCGTC 
TTCCGCTGGC TCGCGGCGCG CACGGGCGAC GCCCGCTGGC ACGCGGCCGC CGGGCGCGCG 
CGGCGCTTCG TGTCGGCGAT GTGGGCGCCG GGCGACGGCC GCTTCCTGAT CGGCACGCGC 
GACGACGGGC ACACGCCGAA CACCGGGCCG TCCGCGCTCG ACGCGTCGCT CTGGCCGCTG 
CTCGCGATGC CGGATGCGCC CGCCGACTGG CGCCGCTCGC TCGCGTGGGT CGAGCGCGCA 
CATCGCATCG ACGGCGGCTA CGGCTTCAAC GCGCATCCGG ACGGTGTCTG GACCGAAGGC 
ACCGCGCAGG CGGCGCTCGC GTTGCAGGCG GCCGGCCGCT CGGACGACGC GCGGCCGCTG 
TGGGCGCTGC TGATGTCGCA GCGCGCGCCG TCCGGCCTGC TGTTTGCGAC GCCCGAGCCG 
AGCATTCGCA CCGGCCTGTC GATCGGGCCG ACGTCCAAGA CCGACGACTT CCGCTACTTC 
CATCTGCCGC ACCTGGGCGC GACCGCGTGG GCCGTGCTCG CGGCGGCGGG CTGGAATCCG 
TTTCGCCCCG GCGGCTGCCT CGCCGCGGGC TACCCGGGCG ACGCCGCCCC TGCCTGCGGA 
GCATGA

Protein sequence

MPMRFHLVRR LGRAASFAIG PMASLLFVAH GAAGAEPPRA ALLAAGCKTL AERVHAPPGS 
GPVFLGSYEP APGGAALAGA LTQAAFVYDN ALASIALIAC HRPGDARRIA DAILQASRQD 
RHYRDARVRN AYRAGALPPG PAPLPGWWDT PSKRWFEDAY QAGTATGNVA WAALSLLAVY 
EATRERRYLD GAAALMGWVD PGRLDATAPA GYVGGEFGHE PQPLRQGWKS TEHNVDAYAV 
FRWLAARTGD ARWHAAAGRA RRFVSAMWAP GDGRFLIGTR DDGHTPNTGP SALDASLWPL 
LAMPDAPADW RRSLAWVERA HRIDGGYGFN AHPDGVWTEG TAQAALALQA AGRSDDARPL 
WALLMSQRAP SGLLFATPEP SIRTGLSIGP TSKTDDFRYF HLPHLGATAW AVLAAAGWNP 
FRPGGCLAAG YPGDAAPACG A