Gene GWCH70_2998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_2998
Symbol
ID	7977367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	3017615
End bp	3019057
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	43%
IMG OID	644799796
Product	carboxyl-terminal protease
Protein accession	YP_002950935
Protein GI	239828311
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000000384491
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATAAAA AAACAACCGC AATACTTATG GCTTTATCGA TGCTAGTTGG TGCCGGGGGA 
ACATATGCCG GCATGCAGCT TGCAGCGCCT GACAGCGATC GTGAAATAAC ACTGGCCGAG 
CCAGATAAAG CGGCAACGAA CGATGACGAG AAAGAACTGA AGAAAGTCGA ACAAGCTTAT 
GAGCTGATTA AAAAACGCTA TGTTGAAAAA GTTGATGATG ATAAACTCAT CCAAGGCGCA 
ATTCAAGGAA TGATTAGCAC GCTGAACGAC CCGTATTCTG TCTATATGGA TGAAGAAACA 
AGCGAACAAT TTACGGAGTC GCTTGACTCT TCGTTTGAAG GAATCGGTGC CGAGGTAAGC 
ATGATGAACG GAAAAGTCAC GATTGTCGCA CCGATTAAAA ACTCGCCGGC AGAAAAAGCG 
GGATTAAAAC CAAATGATCA AATTTTGCGG GTGAATGGCG AGAGTCTAGA AGGGCTTGAT 
TTATATGAAG CCGTGTTGAA AATTCGCGGG GAAAAAGGGA CGACGGTACA ATTGGATATT 
CTTCGCCCCG GCGTAAAAGA AGTGATTAAA GTAAAAGTAG TCCGCGACGA AATTCCGATT 
GAAACGGTTT ATGATTCTGT AAAAACGTAT AACGGGAAAA AAGTCGGCTA TTTAGAAGTA 
ACGTCGTTTT CCGAAAATAC AGCAAAAGAT TTTAAAAAGA AATTAGCAGA ATTAGAAAGC 
AAGCATATCG ACGGGTTAAT CATTGATGTG CGCGGCAACC CAGGCGGCTA TTTGCAAAGT 
GTGGAAGAAA TTTTAAAACA ATTCATTCCG AAAGATAAAC CATATGTACA AATCGAAGAA 
CGCAATGGCG ATAAACAACG TTTTTATTCC GATTTAACGA AGAAAAAACC GTATCCGATC 
GCCGTGTTAA TTGACAAAGG CAGCGCATCC GCTTCGGAAA TTTTAGCTGG TGCCATGAAA 
GAAGCGGGAG GATATAAGCT CGTTGGTGAA ACATCGTTCG GAAAAGGAAC GGTGCAGCAA 
GCGATTCCGA TGGGGGATGG CAGCAACATT AAATTAACGC TCTATAAATG GCTGACGCCG 
GATGGCCATT GGATTCATAA AAAAGGTGTT AAGCCGGACG TTGAAGTAAA GCAGCCGGAT 
TACTTCCACG TTAGTCCGCT TCATATCGAA AAAGAGCTTT CCTTTGATAT GAACAATGAG 
CAAGTAAAAA GTGCGCAACA AATGTTAAAG GGACTTGGAT TTGACCCTGG CCGCACCGAC 
GGCTACTTCA GCAAAGAAAC TGAGTCGGCG GTAAAAGCAT TTCAAAAGGC AAATAAACTC 
CCGCAAACCG GAAAAATCGA TAAAAACACA GCCGAAGTAT TACAAGCAAA AGTGATGGAC 
GCCATTCGCG ACGACAACAA TGATGTACAA CTAAAAACAG CGATGAAAGT GCTGTTTCAT 
TGA

Protein sequence

MNKKTTAILM ALSMLVGAGG TYAGMQLAAP DSDREITLAE PDKAATNDDE KELKKVEQAY 
ELIKKRYVEK VDDDKLIQGA IQGMISTLND PYSVYMDEET SEQFTESLDS SFEGIGAEVS 
MMNGKVTIVA PIKNSPAEKA GLKPNDQILR VNGESLEGLD LYEAVLKIRG EKGTTVQLDI 
LRPGVKEVIK VKVVRDEIPI ETVYDSVKTY NGKKVGYLEV TSFSENTAKD FKKKLAELES 
KHIDGLIIDV RGNPGGYLQS VEEILKQFIP KDKPYVQIEE RNGDKQRFYS DLTKKKPYPI 
AVLIDKGSAS ASEILAGAMK EAGGYKLVGE TSFGKGTVQQ AIPMGDGSNI KLTLYKWLTP 
DGHWIHKKGV KPDVEVKQPD YFHVSPLHIE KELSFDMNNE QVKSAQQMLK GLGFDPGRTD 
GYFSKETESA VKAFQKANKL PQTGKIDKNT AEVLQAKVMD AIRDDNNDVQ LKTAMKVLFH