Gene BTH_I2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_I2044
Symbol
ID	3847442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007651
Strand	+
Start bp	2315739
End bp	2317823
Gene Length	2085 bp
Protein Length	694 aa
Translation table	11
GC content	70%
IMG OID	637841713
Product	serine protease
Protein accession	YP_442568
Protein GI	83718906
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4934] Predicted protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000458004
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATTGGGG AGGGCGGCGC CGGCTTTCGC GAGAGCCGGC GGCGATATTC GTTCACAGGT 
CGTCTGGCGG CCGGGGCGGG AGAGCGGCCT CGTTCGCGCC TGGGCAGCAG TCATCGCGGC 
ACTCGTCCGC AAGCAGTTCG GCGGTTCGCT TTCATGGTGT TTCGACTGTA TTCAAACCGA 
ATGAGGAACG ACAAAATGAC GTCAAGAAAA TGGGCCGGGC TTCGTGCTCC GCAAACGAAG 
CACGCGATTT GCGCGGCGAC GCTTTTTGCC GCGACGACGT TGAGCGCGCA CGCGGCGGCG 
CCGGCGTGGG TCGACACGCA GACCCGCGCT TATCCGGCAT TTCCGCAGCA GGCGCGTGCC 
GCGTCGCAGG CTTCGGCAGC GGCGTCTGCG GCTGGAAAGG CGATCGACGC GGCGCCCGGC 
GAGCCGGTGC GCGTTGTCGT CAGTCTCAAT CTCAACGACG AAGCAAAGCT CGATCGCTTC 
CTGCTCGATC TGCATACCCC CGGCAGCGCC GCTTACGGCC GGCCCCTCAC GCCCGCCGAA 
TTCACCGCGC GGCATGCGCC GACGCCTCAA CAGGTCGCGC TCGTCGAAGC GCATCTGCGC 
CGGGCCGGGT TCCGCGACAT CGAGGTGTCG CCGAACCGGC TGCTGATCTC GGCGACGGGC 
ACCGCGGCCG CGGTCAAGAC GGCGTTCAAC ACGCGGCTCA AGCGCTTCAC GCTCGAGGGC 
CGGCGCGTCT ACGCGAACCA GGACGCGGCG CAGGTGCCCG CCGAGCTCGG CCGGATCGTC 
GGCGCCGTGC TCGGGCTCGA CAACGCGACG CTCGCGCGCA CGTACAACCG CCAGGCGGCG 
GTGACGGGCA CGGTCGGCGG CGCGAAGGCG TCGCTTGCCG CGCGCGCGAG CGACGCGACG 
GCGGCCGCGA GCGGCACGCC CGTGCTGACG GGCCACGATC CGCTCGAATT CTCGCGAATC 
TACCGCGCGG GCGCGACGCC GACGGCTTCA CTGACGACAG TCGGCGTGAT CATGGCGGGC 
GACGCGGCAC CCGTGCTGCG GGATCTCGAC ACGTTCGCGG CGAAGGCGGG GCTCGCGCGC 
GTCGCGGCGA CCGTCACACG CACCGGGCCG CCGGGCAGCG ACTACAACGA CAATTCGGGC 
CTGAGCGAAT GGGATATGGA CAGCCAGGCG ATCGTCGGCG CGGCGGGCGG CGAAGTGAAG 
GGAATCGTGT TCTACGCGGC GCCTTCGATG CTGCTCTCCG ACATCACCGA AGCGTACAAC 
CGCGCAGTCG CGGACAATGT CGCGAAGGTG ATCAACGTGT CGCTCGGCGT GTGCGAGGCG 
GATGCGCGCG CATCCGGCAC GCAGGCGGCG GATGACCGGA TCTTCAAGAG CGCGGTCGCG 
CAGGGGCAGA CGTTCGTCGT CGCGGCGGGC GACGCGGGCG CGTACGAATG CAGCGTGAGC 
CGCGTGTCGG GTGGCCAGGG CGTGCCGGCG CGCTCGAACT ACTCGGTCAG CGAGCCCGCG 
ACGTCGCCGT ACGTCGTCGC GGTCGGCGGC ACGACGCTGT CGACCGACAA GACGACGCTC 
GCGTATGCGG GCGAAGTCGC GTGGAACGAG GGCTTGCAGC CGATCGGCGT GTACGACGCG 
TACGGCAGCT ACGACGGCAC GCAGCGTCTT TGGGCGACGG GCGGCGGTTA CAGCAAGAAC 
GAAGCGGTGC CGGCGTGGCA GCGAAGCGTG CTCGGCGCGT CGGCGAGAAC GCGCGCGCTG 
CCCGACGTCG CGTTCGATGC GGACGGCCGC AGCGGCGCGC ACGTCTATGT GAACGGCCGG 
ACTGAGCAAT GGGGCGGCAC GAGCCTCGCG GCACCGATCT TCACGGGCAT CTGGGCGCGC 
GTGCAATCCG ACAACGGCAA CCGGCTCGGC TTTCCGCTCG CGAGCCTCTA TCGCTACGTG 
CCGTCAAACC GCGCGCTTGC GCGCGACGTG AAATCCGGCC ACAACGGTTC GGGCGGCTAC 
GGCTACAAGG CGGGCGCGGG CTGGGACCCG GTGACGGGCT TCGGCAGCCT CGACGTCGCG 
AACTTCGCCG CGTTCGTGAA GAAGACGGCC GATTTCGCGC GATAA

Protein sequence

MIGEGGAGFR ESRRRYSFTG RLAAGAGERP RSRLGSSHRG TRPQAVRRFA FMVFRLYSNR 
MRNDKMTSRK WAGLRAPQTK HAICAATLFA ATTLSAHAAA PAWVDTQTRA YPAFPQQARA 
ASQASAAASA AGKAIDAAPG EPVRVVVSLN LNDEAKLDRF LLDLHTPGSA AYGRPLTPAE 
FTARHAPTPQ QVALVEAHLR RAGFRDIEVS PNRLLISATG TAAAVKTAFN TRLKRFTLEG 
RRVYANQDAA QVPAELGRIV GAVLGLDNAT LARTYNRQAA VTGTVGGAKA SLAARASDAT 
AAASGTPVLT GHDPLEFSRI YRAGATPTAS LTTVGVIMAG DAAPVLRDLD TFAAKAGLAR 
VAATVTRTGP PGSDYNDNSG LSEWDMDSQA IVGAAGGEVK GIVFYAAPSM LLSDITEAYN 
RAVADNVAKV INVSLGVCEA DARASGTQAA DDRIFKSAVA QGQTFVVAAG DAGAYECSVS 
RVSGGQGVPA RSNYSVSEPA TSPYVVAVGG TTLSTDKTTL AYAGEVAWNE GLQPIGVYDA 
YGSYDGTQRL WATGGGYSKN EAVPAWQRSV LGASARTRAL PDVAFDADGR SGAHVYVNGR 
TEQWGGTSLA APIFTGIWAR VQSDNGNRLG FPLASLYRYV PSNRALARDV KSGHNGSGGY 
GYKAGAGWDP VTGFGSLDVA NFAAFVKKTA DFAR