Gene GWCH70_0614 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_0614
Symbol
ID	7978803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	678419
End bp	679444
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	46%
IMG OID	644797601
Product	thiamine/molybdopterin biosynthesis ThiF/MoeB-like protein
Protein accession	YP_002948775
Protein GI	239826151
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATTGAAC GGTATTCTCG ACAAGAGTTA TTTGCGCCAA TTGGCGCAGA AGGACAAAAA 
AAGATTATGC GGAAACATGT GCTCATTATT GGTGCGGGTG CGCTAGGAAC AGGAAATGCA 
GAGGCGCTTG TGCGGGCAGG CGTTGGCAAA GTCACCATTG TTGACCGCGA TTATGTCGAA 
TGGAGCAATT TGCAACGTCA GCAATTATAT AGCGAAGCGG ACGCAAAAGA ATGTATCCCA 
AAAGCAATTG CTGCAAAGCG GCGGCTTGAA GAGGTAAATT CTGATGTCGC AATTGATGCC 
ATCGTCGGCG ATGTAACGGC ACAAGAGCTT GAAGAGCTTA TTGCAGAGCG AAAGCCCGAC 
CTTTTGATTG ATGCGACAGA TAATTTTGAT ATACGTATGA TTATTAACGA TGCTGCGTAT 
AAATATCGCA TCCCGTGGAT TCACGGCGCG TGTGTCGGAA GCTATGGCAT TAGTTACGCG 
TTTATCCCAG GGAAGACCCC ATGTTTTCAC TGTCTGCTCG AAACGGTGCC AGTAGGCGGT 
TTGACATGTG ATACAGCAGG AATTATCAGC CCTGCTGTGC AAATGGTCGT CGCCTATCAA 
GTAACGGAAG CATTAAAAAT TCTTGTTGAA GATTGGGCGG CGCTGCGCAA TAAACTTGTG 
TCGTTTGATT TATGGAAAAA TCAGCATACG GCGATTCGCA TTGATCAAGT GAAAAAAGAA 
GATTGCCCTA CTTGCGGCAC TCATCCATCG TATCCGTACC TTTCTTATGA TCAACAGACA 
AAAACAGCGG TATTATGCGG ACGAAATTCC GTACAAATTC GCCCGGCTGC GCCTCGAAAC 
TACAACTTGC AAGAGCTGGC TGAATTATTT GTCAAACAAG GATTGCCCGT AGATGTCAAC 
CCGTATCTTG TCTCTGTATC GCTTGGAGAG CGACGGCTTG TTGTCTTTCA AGACGGACGC 
GCGCTCATTC ATGGGACAAA GGATATTCAA GAGGCAAAAA CGATTTATTA TCGCTATTTA 
GGCTAG

Protein sequence

MIERYSRQEL FAPIGAEGQK KIMRKHVLII GAGALGTGNA EALVRAGVGK VTIVDRDYVE 
WSNLQRQQLY SEADAKECIP KAIAAKRRLE EVNSDVAIDA IVGDVTAQEL EELIAERKPD 
LLIDATDNFD IRMIINDAAY KYRIPWIHGA CVGSYGISYA FIPGKTPCFH CLLETVPVGG 
LTCDTAGIIS PAVQMVVAYQ VTEALKILVE DWAALRNKLV SFDLWKNQHT AIRIDQVKKE 
DCPTCGTHPS YPYLSYDQQT KTAVLCGRNS VQIRPAAPRN YNLQELAELF VKQGLPVDVN 
PYLVSVSLGE RRLVVFQDGR ALIHGTKDIQ EAKTIYYRYL G