Gene GWCH70_1591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_1591
Symbol
ID	7976241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	1661811
End bp	1663175
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	46%
IMG OID	644798480
Product	RNA methylase, NOL1/NOP2/sun family
Protein accession	YP_002949652
Protein GI	239827028
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00446] NOL1/NOP2/sun family putative RNA methylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.558771
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAATTAC CAAGCGAATT CATCGAAAAA ATGGAGAGGC TTTTGGAAGA CGAAGCTTCT 
CGTTTTTTTT CCACCTATCA TGAAGAAAAA GCAAACGGTT TGCGGTTCAA TCCATTGAAA 
ATCGACCGCG AGACGTTTTT AACGCTCGTC CCGTTTGCAC TTTCCCCTGT GCCGTTTTGC 
CCAACTGGCT TTTATTATGA CGCACACGAA CAACCTGGAA AGCATCCATA TCATGCGGCA 
GGGCTCTATT ATATCCAAGA GCCGAGTGCG ATGTTTGTAG CGGAAGTGTT AAAGCCAAAT 
CCAGGGGAGT TTGTTCTTGA CCTTTGTGCC GCACCTGGCG GAAAAACGAC TCAGCTTGCG 
GCAATGATGA AAAATCAAGG GCTGATTATC GCCAATGAAA TTCATCCGAA ACGCGTCAAA 
GCACTATCGG AAAATATCGA GCGGTTTGGC ATTACGAATG CGCTTGTTAC GAATGAAACA 
CCGGAAAAGC TCGCAAAATA TTTCCCTGGT TTTTTTGACA AAATTTTAGT AGACGCTCCG 
TGTTCGGGGG AAGGCATGTT TCGAAAAGAC GAAGAAGCCG TGCAATTTTG GAGCCAAGCA 
CACGTCGAAC AATGCGCCAT CAAACAACGG CATATTTTAG ACTGTGCATA CGAGATGTTA 
AAAGAAGGCG GCATTCTCGT CTATTCCACT TGCACGTTTT CTCCGGAAGA AAACGAACAG 
ACCATAGAAG CTTTTTTACA AACCTATGAT GATCTTGAAT TGCTGTCGAT TGAAAAAGTT 
CATGGCATTC AGCCGGGAAG ACGGGAATGG ACGAACACGA ACTTCGAGGA AATGGAGAGA 
ACGGCTCGGC TATGGCCGCA TTCGTTAAAA GGGGAAGGCC ATTTTGTCGC GAAAATAAAA 
AAAACAGGCC CGTCCCCTTC ATGGAATGGA CGCTATGCCA AGCCAAACGC CTCCAAACAA 
ATGGTTCGCG AGTATCGGCA GTTTGAACAA GAAGTATTGC AAACAGAAAT CGAAAAACCG 
ATGTATGCCT TTCAACACCA TCTATTCGCC CTACCTGACC ACTGCCCGAA TTTCGATGGC 
CTGAAAGTCG TGCGGGCAGG TCTTCACTTA GGAGAAGCGA AAAAGCAGCG GTTTGAGCCG 
AACCATGCAC TTGCCTTATC ACTAAAGCCG CAAGACGTTC GTTACTCCCT TGACTTGTCA 
AGCGACAGCG TAGAATGTCT AAAATATTTG CGCGGAGAAA CGATTCAGAC GGGAGAAGAC 
CGCGGCTGGC TGCTTGTGAC CGTTGATGGT TATCCGCTCG GGTGGGGAAA AGAAGTAAAA 
GGTATGGTGA AAAACTTTTA TCCGAAAGGA CTGCGAATCA ACTAA

Protein sequence

MKLPSEFIEK MERLLEDEAS RFFSTYHEEK ANGLRFNPLK IDRETFLTLV PFALSPVPFC 
PTGFYYDAHE QPGKHPYHAA GLYYIQEPSA MFVAEVLKPN PGEFVLDLCA APGGKTTQLA 
AMMKNQGLII ANEIHPKRVK ALSENIERFG ITNALVTNET PEKLAKYFPG FFDKILVDAP 
CSGEGMFRKD EEAVQFWSQA HVEQCAIKQR HILDCAYEML KEGGILVYST CTFSPEENEQ 
TIEAFLQTYD DLELLSIEKV HGIQPGRREW TNTNFEEMER TARLWPHSLK GEGHFVAKIK 
KTGPSPSWNG RYAKPNASKQ MVREYRQFEQ EVLQTEIEKP MYAFQHHLFA LPDHCPNFDG 
LKVVRAGLHL GEAKKQRFEP NHALALSLKP QDVRYSLDLS SDSVECLKYL RGETIQTGED 
RGWLLVTVDG YPLGWGKEVK GMVKNFYPKG LRIN