Gene BURPS668_3628 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3628
Symbol
ID	4883139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3552315
End bp	3553436
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	70%
IMG OID	640129556
Product	ImpA-related N-terminal family protein
Protein accession	YP_001060633
Protein GI	126441470
COG category	[S] Function unknown
COG ID	[COG3515] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03363] type VI secretion-associated protein, ImpA family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.364334
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGACCA ACCTCACCGA GCTGCTGACG CCGATCAGCG AAGCGTCGCC GTGCGGCGAC 
GATCTCCTGT TCTCCGCCGA ATTCGACGCG ATCCAGCACG CGCGCAAGTT CGACGATCCG 
TCGCTCGACC AGGGCGAATG GATCACCGAT ATCAAGGAAG CGGACTGGGG CTTCGTCGTC 
GAGCAAGCGA GCGCGCTGTT GCGCGAGCGC ACGAAGGATC TGCGGCTCGC GGTATGGCTG 
ACCGAGGCGC TCGCGATCGA GGACGGCATC GGTGGGCTCA CGCAGGGCTA CACGCTGCTC 
ACGAGCCTCT GCCGGCAGTT CTGGGACCAC GTGCATCCGC TGCCCGACGG CGACGACGCC 
GAATACCGGC TCGGCAACGT CGCGTGGCTC GCCGGGCGCA CGGTCGAGCT GCTGCGCGCG 
GTGCCGCTCA CCGACGGCGC GGCGAATGCG TTCAGCGAGC TCGACTGGGA CGTCGCGCAA 
CACGTCGCGC AGGCGATCCG GCGCGATCCC GAACAGGCGA GCGAGATCGC GCGCGGCAAG 
CCGTCCGTCG AGCAGATCGA GGCGTCGAAG CGGATGACGC CCGTGGCGTT CTACGCGCGG 
CTGCTCGGCG AGCTGAAAGC GTTCCAGGCG GCGCTCGACG CGCTCGAGCA GGAACTCGAC 
GGGCGGGCGG GCGACGCGGC GCCGAGCTTC CGGCAGGCGC GCGACGCGTA CGAAACCGTC 
TACCGGCTCG CCGAACGCTT CGCGAAGGAG CAGGGCTACT CGGCCGACGC GCAGCCGCAG 
GCCGTCGCGC CGCCCGCGCC GAGCGAGCGC GCGGAGCCGA GCTTCAAGAC GCCGCTTCAT 
TCGGAGGAAC CCGTGCCGAG ACACGCACAC GCGCCGTCCG CGCCCGCGCC GATCGTGATC 
GCCGGCATTC AGAATCGCGC GCAGGCCGTC GAGCAACTGC GCGCGGTCGC GAAATATTTC 
CGCGGAACCG AGCCGCACAG CCCCGTCGCG TATCTCGCCG ACAAGGCGGC CGAATGGGCG 
GACATGCCGC TGCATCAATG GCTCGCGTCG GTCGTCAAGG ACGACGGCTC GCTCGCGCAT 
ATCCGCGAGC TGCTCGGCCT GAAGCCGGAC GATAACGCGT GA

Protein sequence

MPTNLTELLT PISEASPCGD DLLFSAEFDA IQHARKFDDP SLDQGEWITD IKEADWGFVV 
EQASALLRER TKDLRLAVWL TEALAIEDGI GGLTQGYTLL TSLCRQFWDH VHPLPDGDDA 
EYRLGNVAWL AGRTVELLRA VPLTDGAANA FSELDWDVAQ HVAQAIRRDP EQASEIARGK 
PSVEQIEASK RMTPVAFYAR LLGELKAFQA ALDALEQELD GRAGDAAPSF RQARDAYETV 
YRLAERFAKE QGYSADAQPQ AVAPPAPSER AEPSFKTPLH SEEPVPRHAH APSAPAPIVI 
AGIQNRAQAV EQLRAVAKYF RGTEPHSPVA YLADKAAEWA DMPLHQWLAS VVKDDGSLAH 
IRELLGLKPD DNA