Gene GWCH70_1539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_1539
Symbol
ID	7979155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	1613902
End bp	1615770
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	49%
IMG OID	644798432
Product	oligoendopeptidase F
Protein accession	YP_002949605
Protein GI	239826981
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1164] Oligoendopeptidase F
TIGRFAM ID	[TIGR00181] oligoendopeptidase F

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC GATCGTATGT ATGGTTGATT GTCATACTGC TGCTTATTCC GCTTCGAACG 
GATGCGGAAG AAACAAAAAT CAATGCAAAA TACCAATGGA ATCTAGCCGA CATTTACGTG 
TCGGAAGCCA ATTTCAAACG CGACTATCAA GCAGTCGCCG ATGCGTTGCC GAAACTGTCC 
TCCTATGAAG GCAAGCTTGC ACGCGCTTCC AACGTCGCCA AACTATTTGC CCTTAATGAA 
AGGATAGCAC GAAAGCTCGA AAAATTGTCC CTTTATGCTC ACTTAAAACA AGATCTTAAC 
ATTGAAGACA AGACGGCCGC TCATCTAAAA GCGCAAGTGG AAACACTGAT TTCCGACTAT 
GCGGCAAAAA CGGCGTTTAT CGAGCCGGAA CTGCTGTCGC TTTCCGAACG GACGCTTGCC 
AAGCTGCAAA AAAGCAAGCC GCTTAAGCCA TACCGCTATT ATTTTGAAGA ATTGCGCGAA 
CGGAAAAAGC ATACTCTTTC CAAAAGAGAG GAACAGCTGC TCGCCAAGCT TTCTCCCATC 
ATGAGTGATC CGGAAAACAT TTATAACAAT GCCGCGCGCG GCGATTATGA CCCGCCTTCT 
GTGCGCACAC CGGACGGAAA AACGGTTTCG TTGACGGATG AAAACTATAC AAAAGCGCTT 
GAACATCCGG ATCGCAACTA TCGCAAGCGG GCGTTTCAAA CGCGTTTTCA AAGCTATGAA 
ACGATCGAAA ACACATCCGC CGCCACGTTA TACGCATCTG TGAAAGCGGA CGAACTGTAC 
GCGAAAGCGC GAAAATACAA ATCTGGGCTC GATGCGGCAC TATCGGCCGA TGATGTGCCA 
AAACAAGTGT TTACCAATCT CATTTCTACC GTCAATACTC ACTTGCCGTC ACTGCATCGC 
TATGTCGAAC TGCGCAAAAA GGCGCTCGGC GTCGACCGTG TCCACACTTA CGATATGTCT 
GTGCCGCTCG TTGAAGAGAC CATCGCGAAA AAAATGAAGT TTCCGTTCGA AACGGCGCAA 
TCGCTCATCC TTGAAGGGCT GAAACCGCTC GGAGACGACT ACATCCAAAA CGTGCGGCGC 
GCTTTCGAAC AGCGCTGGAT TGACGTCTAT CCGCGCCCAA AAAAATATAC GGGCGGCTAT 
AATACGGGGG CGTACGACAC CCATCCGTTT ATTTTGCTCA ACTACGACGG GTCGCTCGAT 
GGCTTGCTGA CGACCGCCCA CGAAATCGGG CACGCGATGA ATTCCGTCTA TACAAACAAA 
ACGCAGCCAT ACCATTATTC CAGGCAATCG ATTTTTACCG CGGAAGTCGC TTCCACCGCC 
AACGAATGGC TGATGATGGA TTATTTCTTA AAGCAAGCAA AAACGGACGA AGAAAAGCTG 
TATTTGCTCA ACCAGCAAAT CGATCAAATT CGCGGCACAT TATATACGCA AGTAATGTAT 
TCCGAATTCG AACAAGCGAT TCATGACAAA GTGCGGCAAG GCGGGAGCTT AACCGCAGCC 
GAACTGAACG AGCTTTGGCT TCGCCTGTTG AAAAAATATT ACGGCCCTGC CTACGCCGCC 
GATCCGGAAG CTGCGCGCGG CTGGCTGCGC ATTCCGCATT TTTATGATGC GTTTTACGTA 
TACAAATACG CAACCTCGCT CGCCGCTTCC TTTGAGCTTG TCAAGCAAAT GAAAGCGGAT 
GAAACCGGAG AGGCGACTAA ACGCTATTTG CAGTTTTTGC GCTCTGGAAC ATCCGACGAC 
CCGATCCGCC TTTTACAAAA AGCGGGAGTG GATATGACAT CACCGAAGCC GCTCGAGAAC 
CTGCTTTCTT ATTTCGATTC GCTCGTCCGC GAAATGGAAC AGCTGTTGAA AAAACAAGGA 
AGACTGTAA

Protein sequence

MKKRSYVWLI VILLLIPLRT DAEETKINAK YQWNLADIYV SEANFKRDYQ AVADALPKLS 
SYEGKLARAS NVAKLFALNE RIARKLEKLS LYAHLKQDLN IEDKTAAHLK AQVETLISDY 
AAKTAFIEPE LLSLSERTLA KLQKSKPLKP YRYYFEELRE RKKHTLSKRE EQLLAKLSPI 
MSDPENIYNN AARGDYDPPS VRTPDGKTVS LTDENYTKAL EHPDRNYRKR AFQTRFQSYE 
TIENTSAATL YASVKADELY AKARKYKSGL DAALSADDVP KQVFTNLIST VNTHLPSLHR 
YVELRKKALG VDRVHTYDMS VPLVEETIAK KMKFPFETAQ SLILEGLKPL GDDYIQNVRR 
AFEQRWIDVY PRPKKYTGGY NTGAYDTHPF ILLNYDGSLD GLLTTAHEIG HAMNSVYTNK 
TQPYHYSRQS IFTAEVASTA NEWLMMDYFL KQAKTDEEKL YLLNQQIDQI RGTLYTQVMY 
SEFEQAIHDK VRQGGSLTAA ELNELWLRLL KKYYGPAYAA DPEAARGWLR IPHFYDAFYV 
YKYATSLAAS FELVKQMKAD ETGEATKRYL QFLRSGTSDD PIRLLQKAGV DMTSPKPLEN 
LLSYFDSLVR EMEQLLKKQG RL