Gene Bcep18194_A3537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A3537
Symbol
ID	3748714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	-
Start bp	399419
End bp	400624
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	67%
IMG OID	637761811
Product	peptidase S1 and S6, chymotrypsin/Hap
Protein accession	YP_367783
Protein GI	78065014
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family [TIGR02038] periplasmic serine pepetdase DegS

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.727825
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAGAC GCTTCTGGCT GTTCTTCGCG CAGGCGGTTA CCGTGCTGCT CGCGCTGATG 
TTCATCGTCG TGACGCTCAA GCCGCAATGG CTGCAACGGC AAGGACAGCT CGGCAAGCAG 
CTCGCCACGC CGATCGTTGC GCTGCGGGAA GTCGCGCCGG GCATCGGCGG GGCGCCGGCG 
ACCACGTCGT ACGCCGAAGC CGCGCAGAAG GCGATGCCGG CCGTCGTCAA CGTCTTCTCC 
AGCAAGGACG GCTCGCTGCC GCCCGACCCA CGCGCGAAAG ATCCGCTGTT CCGCTACTTC 
TTCGGCGACC GCAACGCCCG CAAGCAGCAG GACGAACCGG CCGCCAACCT TGGCTCGGGC 
GTTATCGTGA GCCCTGAAGG TTACATTCTA ACGAACCAGC ACGTCGTGGA CGGCGCCGAC 
CAGATCGAAG TCGCGCTCGC CGACGGCCGC ACGGCCACCG CGAAGGTGAT CGGCAGCGAT 
CCCGAAACCG ATCTCGCCGT GCTGAAGATC AACATGACGA ACCTGCCGAC GATCACGCTC 
GGCCGCTCCG ACCAGTCGCG GGTCGGCGAC GTCGTGCTCG CGATCGGCAA CCCGTTCGGC 
GTCGGCCAGA CGGTCACGAT GGGGATCATC AGCGCGCTCG GCCGCAATCA CCTCGGCATC 
AACACGTTCG AGAACTTCAT CCAGACCGAC GCACCGATCA ACCCCGGCAA CTCGGGCGGC 
GCGCTGGTCG ACGTGAACGG CAACCTGCTC GGCATCAACA CGGCGATCTA CTCGCGCTCG 
GGCGGCTCGC TCGGCATCGG CTTCGCGATT CCCGTATCGA CTGCGCGCAC GGTGCTGGAA 
AGCATCATCA CGTCCGGCTC GGTCACGCGC GGCTGGATCG GCGTCGAGCC GCAGGACGTC 
ACGCCGGAGA TCGCCGAGTC GTTCGGGCTG TCGCAGAAAT CAGGCGCGAT CGTCGCCGGC 
GTGCTGCAGG GCGGCCCGGC CGACAAGGCC GGCATCAAGC CGGGCGACAT CCTGGTCTCG 
GTCAACGGCG ACGAGATCAC CGACACGACG AAGCTGCTGA ACACCGTCGC GCAGATCAAG 
CCCGGCACGC CGACCAAGGT GCACGTCGTG CGCAAGGGCA AGGAGTTCGA CGTGAACGTG 
GTGATCGGCA AGCGCCCGCC GCCGCCGAAG CAGGCGCTCG ACGAGCAGGA CAGCGATACC 
GAGTGA

Protein sequence

MLRRFWLFFA QAVTVLLALM FIVVTLKPQW LQRQGQLGKQ LATPIVALRE VAPGIGGAPA 
TTSYAEAAQK AMPAVVNVFS SKDGSLPPDP RAKDPLFRYF FGDRNARKQQ DEPAANLGSG 
VIVSPEGYIL TNQHVVDGAD QIEVALADGR TATAKVIGSD PETDLAVLKI NMTNLPTITL 
GRSDQSRVGD VVLAIGNPFG VGQTVTMGII SALGRNHLGI NTFENFIQTD APINPGNSGG 
ALVDVNGNLL GINTAIYSRS GGSLGIGFAI PVSTARTVLE SIITSGSVTR GWIGVEPQDV 
TPEIAESFGL SQKSGAIVAG VLQGGPADKA GIKPGDILVS VNGDEITDTT KLLNTVAQIK 
PGTPTKVHVV RKGKEFDVNV VIGKRPPPPK QALDEQDSDT E