Gene BURPS668_A0344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0344
Symbol
ID	4887497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	315013
End bp	316095
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	68%
IMG OID	640130285
Product	pentapeptide repeat-containing protein
Protein accession	YP_001061350
Protein GI	126443243
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.61884
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACGC GCGCGGATCG ATTGCGCGAC GCGATCCGGC ATGGCCGCGC GATTCGCGAC 
ACCGCGATCG ACGCGGGCGA CTTCGACGGG CACGACTGGT CGGGCGGGGT GTTCGAGCGC 
GTCCGGTTCA TCGGCGTATC GATGAAGCGC GTGCGACTCG ACGAGGCCGT ATTCATCGAT 
TGTCTGTTTT GCGACGTCGA CATGCGGCAA GCGGGCTGCG CGCGATGCAC GTTCGATCGA 
TGCCGGCTCG AACGCGTCGA TCTTTCGGCA AGCGAGCTTC GCGACTGCAT GATGAACGGG 
ACGCATGCGG CCGGCGTGTA TTTTTCCGGT GCGCGGGCGA GCGGTTTGCA TTGCGTGAAG 
AGCGACCTCG GCGATTGCGG GTTCGACGAC GCGCGGATCG AATCGGCGGT GTTCAGCGAC 
ACGCGGCTCG CGCGCGCGGC CTTCACGCGG GCCGCGGTGC GCAAGGCGGT TTTCTATCGG 
CTCGATCTGA CATCGGCCGT TTTCGCCGAT GCGGCGTTCG ACGATACCGT TTTTGCCGAA 
GCGAACCTGG CCGGCCAGCG CTTGCAAGGC CAGCGGATGC ACCGCTGCCA GTTCGTCGGC 
GCGGACCTTC GTCATGCCGA TTTCACCGGG GCGCGCCTCG CCGGCTGCAA CTTCCAGCGC 
GCGAAGCTGA CGGGCGCGCG GCTGGACGGC GTCGACGCGC CGAACACCGT CTTTTTCGAG 
GCCGACGCGC CGGATGCGGC GTGCCGTGAC GCGGCGCTGC GCGGCAGCAT CTGGGTGCAG 
GCCGACGCCC GGCGCATCGA TTTCACCGGC TCGGAACTGG ACGGCGCGGT ATTTCAGCGC 
GCGACGTGCA CGGGTGCGCG CTTTTCGCGG GCGAAGCTCG AAGGCGCGGA TTTTTCGTAC 
GCGGATCTGA CCGGAGCCGT GTTCGACGAG GCCGGTTTCG CGCGAACCGC GTTTCACGGC 
GCGACGGCGC CGGCGATTGC GTGGCGCGAT CATCCGGGCG CCGTCGCGTG CGATGCGGAA 
TTGTCGGATG CGCAGGCGTG GTCGCGGCAA AGGGACGAGC AGGCGCGGCA CGAAGAATGT 
TGA

Protein sequence

MSTRADRLRD AIRHGRAIRD TAIDAGDFDG HDWSGGVFER VRFIGVSMKR VRLDEAVFID 
CLFCDVDMRQ AGCARCTFDR CRLERVDLSA SELRDCMMNG THAAGVYFSG ARASGLHCVK 
SDLGDCGFDD ARIESAVFSD TRLARAAFTR AAVRKAVFYR LDLTSAVFAD AAFDDTVFAE 
ANLAGQRLQG QRMHRCQFVG ADLRHADFTG ARLAGCNFQR AKLTGARLDG VDAPNTVFFE 
ADAPDAACRD AALRGSIWVQ ADARRIDFTG SELDGAVFQR ATCTGARFSR AKLEGADFSY 
ADLTGAVFDE AGFARTAFHG ATAPAIAWRD HPGAVACDAE LSDAQAWSRQ RDEQARHEEC