Gene BURPS1106A_A0757 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0757
Symbol
ID	4905496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	749460
End bp	750686
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	67%
IMG OID	640143863
Product	peptidase family protein
Protein accession	YP_001074793
Protein GI	126456186
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.31218
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAAGC TCCAACACCT CACCGCCGCG GTCTGCAGCG CCCTCTGCGT ATCGGCGGCC 
CATGCCGCGC CGGTGTGGAT CACGCTCTCC GAGCCCGCCC TGCGCGAGCT GCGCGCGCTC 
GATCCCGCCG TGACGAGCCG TTACAGCGCG GCGCTCGCCA CCGGCGACGC GAAGCGCACC 
GAAACGATCC ACGTCGCGCA GGTCGACGAT TCGCTGCTCG AATCGCTGTC GCAGGCGATC 
CGCCGCGCGC GCGGCCACGG CCCGGGCTTT TTCGTGCACG CGACGTTCGA CGAAGCGCGC 
GCGTCGCTGC AGCCGAGCGC GGCGAAGCAG GCGGCCGCGA TCGATTACCC GATCACCTAC 
TCGCAACAGG TCCGCAACTG GATCTCGCAA CTGCAGGCGA GCAACATCGT CAGCACCATC 
GTCTCGCTGT CCGGCTTCAC GAACCGCTAC TACACGACGA CGCACGGCGT GGCCGCGTCC 
GACTGGATCG CGCAGCAATG GAAGCAGTTG GCCGGCTCGC GCACCGACGT GACGGTCGAG 
CAGTTCACGC ATGCCGGCTG GCCGCAGAAA TCGGTGGTCC TGACGATCAA GGGCAGCGAT 
CCGGCCGCGG GCGTCGTCGT GATCGGCGGC CATCTCGATT CGACCGTCGG CCGCATGAGC 
GAGAACACGC GCGCGCCCGG CGCGGACGAC GACGCATCCG GCATCGCAAG CCTCACCGAG 
GCGCTGCGCG TGCTGCTCGC GAACCGCTAC CAGCCGAAGC GCACGCTCAA GTTCATCGGC 
TACGCGGCGG AAGAGGCGGG CCTTCTCGGC TCGCAGGCGA TCGCGAAGCA GTTCAGGGCG 
CAGAACGTGA ACGTCGTCGG CGCGTTCCAG CTCGACATGA CGAACTACAA GGGAGATCCG 
AAGGATATCT ATCTGATCAG CGACTACACG AACGCGACAC AGAACACGTA CCTCGCGAAC 
CTCGCGAAAG CGTATCTGCC CGAGCTCGCG GTCGGCACGT CGCAATGCGG CTATGCGTGC 
TCCGATCACG CGTCGTGGAA CGCGCAGGGC TATCCGGCGT CGTTCCCGTT CGAAGCGGAT 
CAGAACGACA ATCCGTACAT CCATTCCGCG TATGACACGC TCGAGCGGTC GGACTCGCAA 
GGCAACCACG CGCTGAAGTT CAGCAAGCTC GCGCTCGCGT ACGCGGCGGA GCTGGGCGGC 
GGGCTGAGCG CGTCCGCGAA GCGGTAA

Protein sequence

MSKLQHLTAA VCSALCVSAA HAAPVWITLS EPALRELRAL DPAVTSRYSA ALATGDAKRT 
ETIHVAQVDD SLLESLSQAI RRARGHGPGF FVHATFDEAR ASLQPSAAKQ AAAIDYPITY 
SQQVRNWISQ LQASNIVSTI VSLSGFTNRY YTTTHGVAAS DWIAQQWKQL AGSRTDVTVE 
QFTHAGWPQK SVVLTIKGSD PAAGVVVIGG HLDSTVGRMS ENTRAPGADD DASGIASLTE 
ALRVLLANRY QPKRTLKFIG YAAEEAGLLG SQAIAKQFRA QNVNVVGAFQ LDMTNYKGDP 
KDIYLISDYT NATQNTYLAN LAKAYLPELA VGTSQCGYAC SDHASWNAQG YPASFPFEAD 
QNDNPYIHSA YDTLERSDSQ GNHALKFSKL ALAYAAELGG GLSASAKR