Gene BTH_I2742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_I2742
Symbol
ID	3848469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007651
Strand	-
Start bp	3151479
End bp	3152675
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	55%
IMG OID	637842410
Product	type I restriction-modification system specificity determinant
Protein accession	YP_443256
Protein GI	83721596
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.971087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGCTT TGCCTGTTCA CGCAAGGTCC GTTGAGCGAA TTGAAACTCG TGAATTCACT 
GGATCAGGCA CGCGTTTTCA GAACGGCGAC ACCTTGATCG CGCGTATAAC TCCATGCCTT 
GAGAATGGCA AGACGGCTTA TATCTCCGAG CTTCCGGAAG GTGTCGTGGC TCACGGGTCT 
ACGGAATATA TCGTGCTCAG TGGAAAGGTA AATCAGAGTG ACAGCTTGTT TGGCTATTAC 
CTCGTCCGAT CTCCCGATTT TCGACGTCAT GCGATCGGTC ACATGGAAGG TACGTCGGGA 
AGGCAGCGTG TCCCTTCATC CGCAGTAGAG AGATACTCCA CCCGTTTGCC CCCGCTTGCT 
GAACAGCGCG CCATTGCCAA GATCCTTGGC AGCTTGGACG ACAAGATTGA ACTCAACCGC 
GAGAGGAGTG AGACTCTGGA GGCAATGGGC CGCGCCTTGT TCAAGGACTG GTTCGTCGAT 
TTTGGTCCCG TGCGCGCGAA GCAGGAAGGC CGTAGTCCTT ATCTGCCGCG CGAAATTTGG 
GACTTGTTCC CAGAACGGCT GGACACCAAC GAATTGCCGG AAGGCTGGAA GCTTTTGAAG 
GCGAGCGAAC TCATTGAGTT TAATCCTACC GAGTCCTTGC GTAAGGGCGA AGTCGCGCCT 
TACCTCGACA TGGCTTCGCT CCCAACTCAA GGAAGCTGGC CTGATCCCTA TGTCATGCGC 
CCTTTCGGGA GTGGCATGCG CTTCCGCAAT GGCGACACGT TGTTGGCGCG AATTACACCT 
TGTCTGGAGA ACGGAAAAAC AGCATTTATT CAATGTCTTC CCGATGACGT CGTCGGTTGG 
GGATCGACGG AATACATTGT GATGCGGCCA AAGGGGCCTG TGCCTGCGGC GTTTGCTTAC 
TTGTTAGCAA GGAATGATGC CTTCCGAGAA CATGCTATCC GGAGCATGAC TGGTACGTCC 
GGACGCCAGC GCGCTCAGGG CGACGCGGTT GCCGCCTACC AGCTTGCTGC CCCGTTGTGG 
GACGACAAAT TGTGGGCCGT GCTTGCGAGC ATTGTTTCGT TGTTGTTCGA TGGAATCAGA 
TCCAATTCCG AGACGTCGGT AAATCTTGCA AAAATGCGCG ATAACTTGCT TCCCATGTTG 
ATCGCCGGCG CGCTTCGGGT GAAGAACGCC GAGCGAATCC TTGGAGCCGC GACGTGA

Protein sequence

MDALPVHARS VERIETREFT GSGTRFQNGD TLIARITPCL ENGKTAYISE LPEGVVAHGS 
TEYIVLSGKV NQSDSLFGYY LVRSPDFRRH AIGHMEGTSG RQRVPSSAVE RYSTRLPPLA 
EQRAIAKILG SLDDKIELNR ERSETLEAMG RALFKDWFVD FGPVRAKQEG RSPYLPREIW 
DLFPERLDTN ELPEGWKLLK ASELIEFNPT ESLRKGEVAP YLDMASLPTQ GSWPDPYVMR 
PFGSGMRFRN GDTLLARITP CLENGKTAFI QCLPDDVVGW GSTEYIVMRP KGPVPAAFAY 
LLARNDAFRE HAIRSMTGTS GRQRAQGDAV AAYQLAAPLW DDKLWAVLAS IVSLLFDGIR 
SNSETSVNLA KMRDNLLPML IAGALRVKNA ERILGAAT