Gene Bcep18194_C7089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_C7089
Symbol
ID	3734658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007509
Strand	+
Start bp	651208
End bp	652863
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	61%
IMG OID	637760790
Product	hypothetical protein
Protein accession	YP_366777
Protein GI	78060202
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAACA AAGATGATGG ACAGATGGGT GCTGTCTCAT TGCATAACTT GCTATCGGGG 
ATTGGGATGT CGTTTGATGA GGACTTCAAT GGCGTCGCGG CACAGGTGCG CGAGGCGGAG 
GCTGCCGGAC AGTTCGACCG GGCGGCCGAT CTTTTCCACG TCCTGTTTGA ACGATATCCT 
CGTAGCGACG TCGCTCTAAA ATCCTGTCTG GACGCGTTAT TGCGTCAGGG GCAAGCAGGC 
AAAGCGCTCG AGGCTTGCGA GCGCGCCATT GCCGCGACAC CCGAATCGAC CGTTCCGTGG 
CGCGAAAGAG CGCTTCTCTG CTTCAATCAC CTGAACGATC CCGCCGCCGC CATCGCCAGC 
TTGAAAGACG GGCTGGCGGC GTTTCCGTCC AATGCCGAGT TGCATCTGAT GCTTGCCGAC 
GCGAGTTTCC AGATGCTCGA CTTTGAGACG TCACGCCGGC ATGGGATGAA GGCGGCCGAA 
TTCGGCGATC TGACCATCGC GTTGCGAGCA CGCCATCGAT TCATTGAGGA TCACGAAGGT 
GCCGTACACA TCGCACGCGC CATTCTGGAA AGGTACCCGA CGGAGATCGG TGCGCTTGTG 
CAGGGCGGTA TTTCGCTCTA CTTGCTGGGG CGCTTTGAAG AAGGTATCGG CTATCTGTAC 
CGTGCCGCCG AACACGATCC CTATCGGGGC GAAGTCATCT TTCCGCTGGC GAATCTGCTC 
TTGCTGCTGG GTGACACAAA GGCCGGATGG CGCCGATACG AAATGCTCGC GGATCTTGCA 
TCGCTCCGCA GCGGCCCTCG TGAATTGACC ACCTATCACG ACCGCCTGTG GCGCGGACAG 
CCTCTTGATG GCAAGCGCAT TCTGGTGATC AGCCATCTCG GCCTCGGCGA TTGCCTGATG 
TACGCCCGTT ACGCCCGAGA CCTGAAGGCG GCGGGCGCCC ACGTCACGCT CTGCGTCAAG 
CCGGAGTTGA TGCAGCTTCT GCGAGAACTC GAAGGCGTCG ACGAGTTGTT GAGCGCCTGG 
CCCCTCGAGA CGTGGGGCAA CTACGATTAC TGGATCTTCG AAAACCTGCT GCCCGCGAGA 
TTGGGGGCGA GTGACGGGAT CGTGCCTACC TACCGGGACG GCTATATCAA GCTGAAAGAC 
CCGGACGCCG CCAAGGCACT GAACGAGCGC AGTCGCCCAT CCGAGCGGTT GCGAATCGGC 
CTGTGCTGGG ACACGTCGCC CAATTATTTT GCGGGGCGCT CCCGCAGTCT CTTGCCTGAA 
GACCTTCAGC CGTTGGCCGA GATTGAAAAC GTCGACTGGT TCGTGCTTCA GAAACATCCG 
CTCGAGCCGG ATTTCGCGGC ACGTAGCGGG CTGTCGATCC TGAATCGATC CGATGAATGG 
AGCGATCTCT ACGATACGGC GGTATTTGCG GCATCCCTCG ATCTGACCAT CTCGATCTGC 
TCGGCGCCCG TACACCTGGC TGGTTCGCTG GGCCTGCCAG CGTGGGTCAT GCTGGGTGCG 
CCGGAGTGGC GGTGGGGCGC GCAAGGCGAC ACGGGGCCCT GGTATCCGCA CATCCGCGTC 
TTCCGGCAGG CGACACCCGG TAACTGGCGT AGCGTTACCG AGGCGGTGCG TGCCGCACTC 
GAATCGGAGC GCGGGGGCTT GCGTCGAGTG GCTTGA

Protein sequence

MRNKDDGQMG AVSLHNLLSG IGMSFDEDFN GVAAQVREAE AAGQFDRAAD LFHVLFERYP 
RSDVALKSCL DALLRQGQAG KALEACERAI AATPESTVPW RERALLCFNH LNDPAAAIAS 
LKDGLAAFPS NAELHLMLAD ASFQMLDFET SRRHGMKAAE FGDLTIALRA RHRFIEDHEG 
AVHIARAILE RYPTEIGALV QGGISLYLLG RFEEGIGYLY RAAEHDPYRG EVIFPLANLL 
LLLGDTKAGW RRYEMLADLA SLRSGPRELT TYHDRLWRGQ PLDGKRILVI SHLGLGDCLM 
YARYARDLKA AGAHVTLCVK PELMQLLREL EGVDELLSAW PLETWGNYDY WIFENLLPAR 
LGASDGIVPT YRDGYIKLKD PDAAKALNER SRPSERLRIG LCWDTSPNYF AGRSRSLLPE 
DLQPLAEIEN VDWFVLQKHP LEPDFAARSG LSILNRSDEW SDLYDTAVFA ASLDLTISIC 
SAPVHLAGSL GLPAWVMLGA PEWRWGAQGD TGPWYPHIRV FRQATPGNWR SVTEAVRAAL 
ESERGGLRRV A