Gene BURPS668_A0341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0341
Symbol
ID	4886319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	309005
End bp	310108
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	74%
IMG OID	640130282
Product	ImpA, N-terminal
Protein accession	YP_001061347
Protein GI	228993424
COG category	[S] Function unknown
COG ID	[COG3515] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03363] type VI secretion-associated protein, ImpA family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.402046
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCCCA GCAGAAAACC GGCCGGCAGG GCGGCTGCCG CGCGCACGCC GAAGCCCGAC 
GGCTGGATGG CGCCCGTCGA TGCGGTCGCG CCGTGCGGAG CGGACCTTGA ATACGATCCC 
GAGTTCGTCG TGCTCGCGGC GAAGGTCGCG CCGCGCGCCG AAGCGCAGTA CGGGGACTTC 
GTCGGCTCGC CGGAGCCGGT GAACTGGAGC GACGTCGAGC GCGACTGCCG ACGGCTGATG 
ATGCGCAGCA AGGACATGCG CCTCGCGGTG CTGTTCGCGC GCAGCCGCAC GCGGCTTGCC 
GGCGCGACCG GGCTCGCGGA AGGCATTGGC TTGCTGGCCG CGTGGCTCGC CGCGTTTCCC 
GATGCGATTC ATCCGCAAGC CGACGTCGAC GCGGACCGCG ACGCGGCGCT CGAGATCCGG 
CGCAACGCGC TGCAGGCGCT GACCGATGCC GACGGGCTGC TGGCGGACGT GCGCGAGATC 
GCGCTGACCC GCTCGAGCGC GACGCGCCTG CAGGTGCGCG ACGTGGAACG CGCGTTCGCG 
CAACCGCGGC CCGGCGATGC GCTCGCGCCG GAATCGGTCG TGCGCCAGCT CGACGATTTG 
CACGCGCAGC AGCCGGAGAC GCTCGCGGGC TTCGGCGATG CGCTCGCGGG GCTGGCCGCG 
ATCGGCGCCT GGAGCGGCGA GCATCTCGGC GATTATGCGC CGGACCTGTC GGCGCTCGAT 
GCGCTGCTGC GCCGGATCGC GGGCGCGAAC GCGCGCGGCG ATCGCGCGGA GGCCGAGCCG 
ATCGCGCCGG CCGAAGCCGA TGCGCCGCCG GCGAGCGAGG CGGCGGCCGT GCACGCACAC 
GCATCGCCGC CGCGGCGGCG CGAGCCCGCG GCGCAGGCGC TCGCGGCTGC CATTGCGGGC 
GAACCGGCCG CGCAGCCGGT GGATCGTTAC GCGGCGCGCG AGCTGATCCG GCAGGCGCGC 
CAGTGGTTCG AGCAGCACGA GCCGAGCAGC CCGATTCCGA TTCTGCTCAG GCGCGCGGAG 
CATTTCGTCG GCAAGCGCTA TGCGGATGTG GTGCAGGCGA TTCCCGCCGA GCTGCTCGCG 
CTGTGGAGCG CGGACGAAAC CTGA

Protein sequence

MTPSRKPAGR AAAARTPKPD GWMAPVDAVA PCGADLEYDP EFVVLAAKVA PRAEAQYGDF 
VGSPEPVNWS DVERDCRRLM MRSKDMRLAV LFARSRTRLA GATGLAEGIG LLAAWLAAFP 
DAIHPQADVD ADRDAALEIR RNALQALTDA DGLLADVREI ALTRSSATRL QVRDVERAFA 
QPRPGDALAP ESVVRQLDDL HAQQPETLAG FGDALAGLAA IGAWSGEHLG DYAPDLSALD 
ALLRRIAGAN ARGDRAEAEP IAPAEADAPP ASEAAAVHAH ASPPRRREPA AQALAAAIAG 
EPAAQPVDRY AARELIRQAR QWFEQHEPSS PIPILLRRAE HFVGKRYADV VQAIPAELLA 
LWSADET