Gene Bphy_3946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bphy_3946
Symbol
ID	6245476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia phymatum STM815
Kingdom	Bacteria
Replicon accession	NC_010623
Strand	+
Start bp	918101
End bp	919126
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	65%
IMG OID	642595708
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_001860115
Protein GI	186472773
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGTTC TCGGCATAGA AAGCTCCTGC GACGAAACCG GCCTTGCGCT CTACGACACG 
GAGCGCGGTC TGCTTGCTCA CGCGCTGCAT TCGCAGATCG CGATGCATCG CGAGTACGGC 
GGTGTGGTGC CGGAGCTGGC GTCGCGCGAC CATATCCGGC GCGCGCTGCC GTTACTCGAA 
GAAGTGCTGG AGCGATCGGG CGCGGCGCGC GGCGACATCG ACGCAATCGC GTACACGCAG 
GGTCCGGGGC TCGCGGGCGC GCTGCTGGTG GGCGCGAGCA TTGCCAATTC GCTGGCGATG 
GCGTGGAACA AGCCGACCAT CGGCATTCAT CATCTGGAAG GGCATTTGCT GTCGCCTTTG 
CTCGTCGATG AGCCGCCGCC ATTTCCGTTC GTCGCGCTGC TGGTGTCGGG CGGTCATACG 
CAGCTGATGC GCGTCACGGA TGTCGGCGTC TACGAGACGC TCGGCGAAAC ACTCGACGAT 
GCAGCCGGCG AAGCGTTCGA CAAGACAGCC AAGCTGCTCG GGCTGGGTTA TCCGGGCGGT 
CCGGAAGTCT CGCGCCTGGC GGAATTCGGC ACGCCGGGCG CGGTCGTGCT GCCGCGTCCG 
ATGCTGCATT CCGGCGACCT TGATTTCAGT TTCAGCGGGC TCAAGACGGC TGTGCTGACG 
CACGTGAAAA AGCTCGGCGG CAATGTGTGC GAGCAGGCCA AGGCGGATCT CGCGCGGGGC 
TTCGTCGATG CAGCCGTCGA GGTGTTGGCC GTCAAGTCTT TGGCTGCGCT CAAGAAGACG 
AAGCTCAAGC GGCTCGTGGT GGCGGGCGGC GTCGGCGCTA ACCGGCAGTT GCGGGAGGCG 
TTGTCTTCGG CCGCGCAGAA GCGCGGGTTC GCTGTGCACT ATCCGGATCT GTCACTGTGC 
ACGGACAATG GGGCGATGAT TGCGCTCGCG GGTGCGTTGC GAATGCAGCG GTGGCCCGCG 
CAGGCTACCG ATGATTATGC TTTTACCGTA AAGCCGCGGT GGGATTTGGG GTCGCTGGGC 
GCTTGA

Protein sequence

MLVLGIESSC DETGLALYDT ERGLLAHALH SQIAMHREYG GVVPELASRD HIRRALPLLE 
EVLERSGAAR GDIDAIAYTQ GPGLAGALLV GASIANSLAM AWNKPTIGIH HLEGHLLSPL 
LVDEPPPFPF VALLVSGGHT QLMRVTDVGV YETLGETLDD AAGEAFDKTA KLLGLGYPGG 
PEVSRLAEFG TPGAVVLPRP MLHSGDLDFS FSGLKTAVLT HVKKLGGNVC EQAKADLARG 
FVDAAVEVLA VKSLAALKKT KLKRLVVAGG VGANRQLREA LSSAAQKRGF AVHYPDLSLC 
TDNGAMIALA GALRMQRWPA QATDDYAFTV KPRWDLGSLG A