Gene BURPS668_1174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1174
Symbol
ID	4883833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1151754
End bp	1152815
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	74%
IMG OID	640127102
Product	hypothetical protein
Protein accession	YP_001058223
Protein GI	126438901
COG category	[R] General function prediction only
COG ID	[COG2962] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGTCCA TCGCCGATTC CTCTCGCGCC GCGTTGCGCG GCGTGCTGTA CGTTGCGTTG 
TCGGCTGTCG CGTTCGGCGC GATGGCGATC TTCGGCCGCT ACGCGTACGC GGGCGGCGCC 
GACGTGCTCG GCCTCCTGAT CGTTCGCTTT TCGATCGCGG GGGCGCTGCT CGTCGCCGTC 
GCGCGCCGCC GCCGCGTGCG CTGGCCGCGC GGCCGCGCGC TCGCCGCGAT CGTCGGCATG 
GGCGCGCTCG GCTATGTCGG CCAGTCGCTG TGCTATTTCA GCGCACTGCA ACACGCGCAG 
GCGAGTCTCG TCGCGCTGCT GCTCTATCTA TACCCGGCGT TCGTCGCGCT GCTTGCCGCC 
TGGTGGCTCG GCGAGCGGCT CACGCGCGCG AAGGCCGTTG CGCTCGCGCT GTGCGTCGCC 
GGTTCGGCGC TGATGGTGGG CGGCGGCCGC GGCGAGCCGC TCGGCATCGC GCTCGCGCTC 
GGCGCGGCCG TCGTCTACTC ACTGTATATC GTCGTCGGCG CGAAGGCGGC GCGCGGCGTC 
GATCCGCTCG CGACCGTCGC GGTCATTTGT TGCGCCGCGG CCGCGATGCT CGCCATGCTC 
GCGCTCGCGC GGGCAGCGGC GTTCGACGCG CCGCCGCATT GGCCGCGCGC GGCGGCCGGC 
TGGGCGGCGC TCGTCGCGAT CGCGCTCGTG TCGACCGTCG CCGCGATGCT CGCGTTCTTC 
GCCGGTCTCG CGCGGCTTGG CGCGGCCCGC ACGTCGATGC TCTCGACGCT CGAGCCCGTC 
GTGACAGTCG CGCTTGCCGC CGCGTTGTTC GGCGAGACGC TGACGCCGCT GCAATGGGCG 
GGCGGCGTCG CGATCCTGGC GGCGGTATTG TGGCTCGTGC GCGCGGGCGA CGCAGCCGAT 
TCGCGCGGAG CCGGCGACGA TCGCGAGCGT CGCCGGCTCG GGCGGCGAGA TGACGAGCCG 
AGTGCGCCGG GCGGGAGCGG GGCCGGCGGC GGGCCGGCTG GCTTCGTCGA TCCGAACGAA 
TGCGGAATCC GGCGCGTACG GAGCGCGGAC GAGAACGCGT GA

Protein sequence

MPSIADSSRA ALRGVLYVAL SAVAFGAMAI FGRYAYAGGA DVLGLLIVRF SIAGALLVAV 
ARRRRVRWPR GRALAAIVGM GALGYVGQSL CYFSALQHAQ ASLVALLLYL YPAFVALLAA 
WWLGERLTRA KAVALALCVA GSALMVGGGR GEPLGIALAL GAAVVYSLYI VVGAKAARGV 
DPLATVAVIC CAAAAMLAML ALARAAAFDA PPHWPRAAAG WAALVAIALV STVAAMLAFF 
AGLARLGAAR TSMLSTLEPV VTVALAAALF GETLTPLQWA GGVAILAAVL WLVRAGDAAD 
SRGAGDDRER RRLGRRDDEP SAPGGSGAGG GPAGFVDPNE CGIRRVRSAD ENA