Gene GWCH70_3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_3041
Symbol
ID	7977405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	3058458
End bp	3059957
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	51%
IMG OID	644799835
Product	helicase domain protein
Protein accession	YP_002950974
Protein GI	239828350
COG category	[L] Replication, recombination and repair
COG ID	[COG4098] Superfamily II DNA/RNA helicase required for DNA uptake (late competence protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0601765
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCGTTTTA TTGTGGATGA AGGAAGGTTG ATTCCCGAAG CATTGGCCAA AACCAATGAC 
CAAACTGCTA AACCGATCAG CTACATTGAT GTCGCGTCTT CTATCCCAAT GCACCCCGAG 
TTTCCTTACT CCCCAGAACT CCTTTCCTTT CTGGAAGGAA AACAGCTTCT CCTCGAGGAA 
CTTCCTTTTC CTCTCGAGAT GATTCAAGCC CATTATGAAC ACGGCTACCT TTCCTATGAA 
AAAGGGATTG CGAAAACGAA ACATGGATGG CGTTGCATGA GGTGCGGAAA CGAGGAGAAT 
CATTTTTTCG CCTCATTTCC TTGTGCACGC TGTCAAGCGG TTTGTACATA TTGCCGCAAA 
TGCATTATGA TGGGGCGAGT CAGTACATGC ACCCCGCTGG TTGTATCCCG CTTTTCTTTC 
CCTCAAGCTT GCTATTTTTC CCCGCTTTCC TGGAACGGAA TATTATCCCA AGGCCAGCAG 
CGTGCTGCCG ATGCGGTGGA GGACGCAATC GTGCGGAATG ACGAATTGCT CGTATGGGCG 
GTTTGTGGCG CTGGAAAAAC GGAGGTATTG TTTCCAGGCA TCGCGCGGGC GCTTGAGATG 
GGAAAACGCG TATGTATTGC CACCCCAAGA ACCGACGTCG TGCGCGAGCT TGCCCCCCGT 
TTGAAACAAG CATTTCCAAG CGTCCCATTG ATCGCCTTGT ACGGCGGCAG CGACGACCGC 
GGCAAATTCG CCCCTTTTGT TATTTCCACC ACCCATCAGC TATTACGGTT TTACCGCGCT 
TTTGATGTGA TGGTGATTGA TGAAGTCGAC GCCTTCCCGT ATTCGATGGA ACCGATGCTT 
GAATATGCTG TCGCAAAAGC GCGCAAAGAG ACATCCAGTC TTATTTATTT AACGGCAACT 
CCACATCCAG CTTGGCAGAA AGAAATCAAG CGCGGCAAAC GAAAAGCGGT CACCATTCCC 
GCCCGCTACC ACGGTTTTCC CCTTCCTGTC CCGTCCTTCG AATGGTGTGG CAACTGGCGC 
AAGCAGTTAA AGCGCAGTCG TCTTCCCCGC AACGTCATCA CCTGGGTGAA ATTGCGCATT 
GAAACAGCAA AACAAGCGTT TTTATTCGTC CCCCATATTG ATGAGCTCGA GCAAGTTGTA 
CGTATATTGA AACAATTAGA CGAGCGGATC GAAGGCGTTC ACGCGGAAGA TCCGAAGCGC 
GCGGAAAAAG TGCAAGCGTT TCGTGACGGT CGCATTCCGC TTCTTGTCAC TACGACGATT 
TTGGAACGCG GCGTGACCGT TCCGAACATC GATGTTGCCG TGCTTGGCGC GGAAGACCGC 
ATTTTTACGG AAAGCGCGCT CGTGCAAATT GCCGGCCGCG TCGGGCGAAG CGCTCAATTT 
CCAAGCGGTG ACATCCGTTT TTTCCATTAC GGAAAAACGC GGGAAATGGT CGCGGCGAAA 
CGACAGATTG AGCGAATGAA TAAGGAGGCT TCAGAAAGGG GGATGTTAAA AACGCAATGA

Protein sequence

MRFIVDEGRL IPEALAKTND QTAKPISYID VASSIPMHPE FPYSPELLSF LEGKQLLLEE 
LPFPLEMIQA HYEHGYLSYE KGIAKTKHGW RCMRCGNEEN HFFASFPCAR CQAVCTYCRK 
CIMMGRVSTC TPLVVSRFSF PQACYFSPLS WNGILSQGQQ RAADAVEDAI VRNDELLVWA 
VCGAGKTEVL FPGIARALEM GKRVCIATPR TDVVRELAPR LKQAFPSVPL IALYGGSDDR 
GKFAPFVIST THQLLRFYRA FDVMVIDEVD AFPYSMEPML EYAVAKARKE TSSLIYLTAT 
PHPAWQKEIK RGKRKAVTIP ARYHGFPLPV PSFEWCGNWR KQLKRSRLPR NVITWVKLRI 
ETAKQAFLFV PHIDELEQVV RILKQLDERI EGVHAEDPKR AEKVQAFRDG RIPLLVTTTI 
LERGVTVPNI DVAVLGAEDR IFTESALVQI AGRVGRSAQF PSGDIRFFHY GKTREMVAAK 
RQIERMNKEA SERGMLKTQ