Gene BURPS668_A2676 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2676
Symbol
ID	4888449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2563532
End bp	2564587
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	71%
IMG OID	640132612
Product	protease family protein
Protein accession	YP_001063668
Protein GI	126443675
COG category	[R] General function prediction only
COG ID	[COG1266] Predicted metal-dependent membrane protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.451283
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATGTA CCATTGCGCC CCGTACGCGC CGTATTCCGA GACCTGGCCG AGCGACGTAC 
GCGAAGGCAT TTCGTAAGCC GGATCATCGA GAAATCCAGG ACGCGCAAAT GGGAGATGTG 
AACAGAACCG GCTGGCCGCC CCGTTTACCG CCGCGGCTCA AACGCATCTG GTACGGTGCG 
GGCGGCCTGC GCGCCGGCTG GGCCGTGCTG CTTTACGCGG CGATCGTCGC GGCGATCCTG 
CTTGCGCTCG GCGCCGCCGC GCGCATCGCG CATCATCCGT TCCGGCCGCG CGGCGATCTG 
AGCACGGCCG GCCAGATGCC GTTCGAGCTC GCGCTGTGCG CGGCCGCGCT GATCGCCACG 
CACGTGATGA GCCGCCTCGA TCGCCGCTCG TGGCTCGATT ACGGCCTGCG CGCGCGGCGC 
GCCGCGTTGC ATTTCGGATG GGGTGCGTTC TGCAGCCTCG CCGCCGTGTC GGCGATCATG 
GGCCTGCTCG TCGCCACCGG CGGCGCGACG ATCGAATACT CGGGCGCGAA CCGCGCGGCT 
GCATTCGAAT CGGCCGTCAC CTGGGCGTGC GCGTTCGTGC TCGTCGCGCT CGCGGAGGAA 
ATCGCGTTTC GCGGCTATGC GTTCTTCAAG CTCGCGCAGC GCACCCACCC CGTCGTCGCG 
GCGGCGCTCA CGTCGCTCGC GTTCGGCCTC TCGCACGTGT CGAACCGCAA CGAGAACATC 
GCGGGCATCG TGCCCGTCGT GATCTACGGG CTCGTCGCAT GCCTCGCGAT CTGGCGCACC 
GGCTCGCTGT GGTGGGCGCT CGGCGAGCAC GCGATGTGGG ACTGGAGCGA ATCGTTCCTG 
TTCGGCGCGG CCGACAGCGG GCTTACCGCG CACGACACGC TGTTCATGAG CCATGCGATC 
GGCCCCGTGT GGCTGAGCGG CGGCACGGTC GGCCCCGAGG CGAGCGTGCT CGTGTTTCCG 
GCGCTCGCGG CGCTCGCGTA CGTCGCCTGG CGCCTGCCGT CGCGCATGGT GCCGAGCGGC 
CCGCCGCTCG CGCGCGGACG CCGGCAGGCG GCGTGA

Protein sequence

MGCTIAPRTR RIPRPGRATY AKAFRKPDHR EIQDAQMGDV NRTGWPPRLP PRLKRIWYGA 
GGLRAGWAVL LYAAIVAAIL LALGAAARIA HHPFRPRGDL STAGQMPFEL ALCAAALIAT 
HVMSRLDRRS WLDYGLRARR AALHFGWGAF CSLAAVSAIM GLLVATGGAT IEYSGANRAA 
AFESAVTWAC AFVLVALAEE IAFRGYAFFK LAQRTHPVVA AALTSLAFGL SHVSNRNENI 
AGIVPVVIYG LVACLAIWRT GSLWWALGEH AMWDWSESFL FGAADSGLTA HDTLFMSHAI 
GPVWLSGGTV GPEASVLVFP ALAALAYVAW RLPSRMVPSG PPLARGRRQA A