Gene Bcep18194_B1097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_B1097
Symbol
ID	3752862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007511
Strand	+
Start bp	1237425
End bp	1238864
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	71%
IMG OID	637765946
Product	peptidase S1C, Do
Protein accession	YP_371855
Protein GI	78061947
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.676957
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0936478
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGG GCAGGCACAC GAACCTGGCA GCGGTGCTGC GAGCGATGGC CGGCGGGCTG 
GCGTTGGCCG GTGCGTGCGC ATGCGGTTGT TCGACGGCAA CGGCTGCCGA GCGGCCCGCG 
CAGCCGGGCG CCGCATCGCC AACGCCGACG CCGACCGTCG CGCTGCCGAA TTTTGCGGCG 
CTGGTCCGGC GCGTCGGCCC GGCCGTCGTC AACATCAGCG TCACGCGCGA AGTCACGCAG 
ATGGGCATCC AGTTGCCGCC GGGCATCGCG CCCGATCATC CGCTCGCGCC GTTTCTTGCG 
CGGCGCGTGA TCGGCAACCG CGAGGAGGTG AGCCTCGGTT CGGGCTTCAT CGTCAGCGAG 
GACGGCGTGA TCCTGACCAA CCGGCACGTG GTCGGCGACG CCGTTGCGAT CGACGTGAAG 
CTGACCGACA AGCGGCAGTT CAAGGGGCGC GTGATCGGCA GCGATCCCGT CTCCGACGTC 
GCGGTGATCC GCATCGACGC GCACAACCTG CCGGTCGTCG CGACCGGCGA CCCGGCGCGC 
ACCGAAGTGG GCGACTGGGT AATGGCGATC GGCTCGCCAT ACGGGTTCGC GAACACGGTC 
ACGCAGGGCA TCGTCAGCGC GAAATCGCGC TCGTTGCCCG GCGAGCGCGC GATTCCGTTC 
ATCCAGACCG ACGTGCCGAT CAACCCCGGC AATTCGGGCG GCCCGCTGTT CGATCTCGGC 
GGCCGGGTGA TCGCGATCAA CTCGATGATC TTCTCGAAGA CGGGCGGCTA TCAGGGGCTT 
GCGTTTGCGA TCCCGATCGA TATCGCGCTC GACGTGAAGG ACCAGTTGCT GCGAACCGGC 
AAGGTCACGC GCGGCCGGCT CGGCGTGGCC GTCCAGGAAG TGAGCCAGGC GCTGGCGCGT 
TCGTTCGGCC TTGCCAGCCC CGACGGCGCG CTGATCACCA TGGTCGAGCC GGATGGCCCG 
GCCGCGCACG CGGGCCTGCA GCCGGGCGAC GTCGTGCTCG CGGTCGATGG CAAGCCGGTC 
GCCGAATCGT CGGACCTGCT CGGCACCGTT GCGGGCATGC GTGCCGGCCG GCAAGCCGAC 
CTGCTCGTAT GGCGCGCCGG ACGGGCGATG CACATGAGCG CGACGGTCGG CGCATTCGAC 
AGCGGCACAG CGGCGGCGAG CGGCGAGCAA GGGCCCGCGC GGTTCGGGCT CGCGTTGCGC 
GCGGCGACGG AGCAGGAGCG CCAGCGGCTC GGTGTCGGGC AGGCGCTCGT CGTCGAGCAG 
GCGAGCGGCC AGGCTGCGCG CGCGGGGTTG CAGCCCGGCG ATGTCGTGCT GTCGGTCAAC 
GGCACGCCGG TCGCGAACAT CGGTGCGCTG ATGACCGAGA TCGACGCCGC GCACGGCAAC 
GTCGCGCTGC TCGTCCAGCG CGGCGGTACG CGGCTGTATG TGCCGATCGA GATCGGTTGA

Protein sequence

MKAGRHTNLA AVLRAMAGGL ALAGACACGC STATAAERPA QPGAASPTPT PTVALPNFAA 
LVRRVGPAVV NISVTREVTQ MGIQLPPGIA PDHPLAPFLA RRVIGNREEV SLGSGFIVSE 
DGVILTNRHV VGDAVAIDVK LTDKRQFKGR VIGSDPVSDV AVIRIDAHNL PVVATGDPAR 
TEVGDWVMAI GSPYGFANTV TQGIVSAKSR SLPGERAIPF IQTDVPINPG NSGGPLFDLG 
GRVIAINSMI FSKTGGYQGL AFAIPIDIAL DVKDQLLRTG KVTRGRLGVA VQEVSQALAR 
SFGLASPDGA LITMVEPDGP AAHAGLQPGD VVLAVDGKPV AESSDLLGTV AGMRAGRQAD 
LLVWRAGRAM HMSATVGAFD SGTAAASGEQ GPARFGLALR AATEQERQRL GVGQALVVEQ 
ASGQAARAGL QPGDVVLSVN GTPVANIGAL MTEIDAAHGN VALLVQRGGT RLYVPIEIG