Gene BURPS1106A_A0250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0250
Symbol
ID	4905379
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	240083
End bp	241198
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	74%
IMG OID	640143357
Product	ImpA-related N-terminal family protein
Protein accession	YP_001074293
Protein GI	226830796
COG category	[S] Function unknown
COG ID	[COG3515] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03363] type VI secretion-associated protein, ImpA family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCCCA GCAGAAAACC GGCCGGCAGG GCGGCTGCCG CGCGTACGCC GAAGCCCGAC 
GGCTGGATGG CGCCCGTCGA TGCGGCCGCG CCGTGCGGAG CGGACCTTGA ATACGATCCC 
GAGTTCGTCG TGCTCGCGGC GAAGGTCGCG CCGCGCGCCG AAGCGCAGTA CGGGGACTTC 
GTCGGCTCGC CGGAGCCGGT GAACTGGAGC GACGTCGAGC GCGACTGCCG ACGGCTGATG 
ATGCGCAGCA AGGACATGCG CCTCGCGGTG CTGTTCGCGC GCAGCCGCAC GCGGCTTGCC 
GGCGCGACCG GGCTCGCGGA AGGCATTGGC TTGCTGGCCG CGTGGCTCGC CGCGTTTCCC 
GATGCGATTC ATCCGCAAGC CGACGTCGAC GCGGACCGCG ACGCGGCGCT CGAGATCCGG 
CGCAACGCGC TGCAGGCGCT GACCGATGCC GACGGGCTGC TGGCGGACGT GCGCGAGATC 
GCGCTGACCC GCTCGAGCGC GACGCGCCTG CAGGTGCGCG ACGTGGAACG CGCGTTCGCG 
CAACCGCGGC CCGGCGATGC GCTCGCGCCG GAATCGGTCG TGCGCCAGCT CGACGATTTG 
CACGCGCAGC AGCCGGAGAC GCTCGCGGGC TTCGGCGATG CGCTCGCGGG GCTGGCCGCG 
ATCGGCGCCT GGAGCGGCGA GCATCTCGGC GATTATGCGC CGGACCTGTC GGCGCTCGAT 
GCGCTGCTTC GCCGGATCGC GGGCGCGAAC GCGCGCGGCG ATCGCGCGGA GGCCGAGCCG 
ATCGCGCCGG CCGAAGCCGA TGCGCCGCCG GCGAGCGAGG CGGCGGCCGC GCACGCACAC 
GCACACGCAC ACGCATCGCC GCCGCGGCGG CGCGAGCCCG CGGCGCAGGC GCTCGCGGCT 
GCCATTGCGG GCGAACCGGC CGCGCAGCCG GTGGATCGTT ACGCGGCGCG CGAGCTGATC 
CGGCAGGCGC GCCAGTGGTT CGAGCAGCAC GAGCCGAGCA GCCCGATTCC GATTCTGCTC 
AGGCGCGCGG AGCATTTCGT CGGCAAGCGC TATGCGGATG TGGTGCAGGC GATTCCCGCC 
GAGCTGCTCG CGCTGTGGAG CGCGGACGAA GCCTGA

Protein sequence

MTPSRKPAGR AAAARTPKPD GWMAPVDAAA PCGADLEYDP EFVVLAAKVA PRAEAQYGDF 
VGSPEPVNWS DVERDCRRLM MRSKDMRLAV LFARSRTRLA GATGLAEGIG LLAAWLAAFP 
DAIHPQADVD ADRDAALEIR RNALQALTDA DGLLADVREI ALTRSSATRL QVRDVERAFA 
QPRPGDALAP ESVVRQLDDL HAQQPETLAG FGDALAGLAA IGAWSGEHLG DYAPDLSALD 
ALLRRIAGAN ARGDRAEAEP IAPAEADAPP ASEAAAAHAH AHAHASPPRR REPAAQALAA 
AIAGEPAAQP VDRYAARELI RQARQWFEQH EPSSPIPILL RRAEHFVGKR YADVVQAIPA 
ELLALWSADE A