Gene GWCH70_2347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_2347
Symbol
ID	7977837
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	2389366
End bp	2390634
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	39%
IMG OID	644799155
Product	protein of unknown function DUF445
Protein accession	YP_002950315
Protein GI	239827691
COG category	[S] Function unknown
COG ID	[COG2733] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATCTA AAAAGTCAAA GCAACCAAAG AAATCAAAGC GATTAGCTAG TTTTTCGCTT 
GTTGTTATGG GAACCGGCTT TGTCGCAACC ATTCCTTTCC AAGGATCGTT TCTAGGCGGA 
TTACTACAAG GAGGCTTTGA GGCGGGGCTT GTGGGTGGAT TAGCCGACTG GTTCGCCGTT 
ACTGCCTTAT TCCGACATCC ATTGGGGCTT CCCATCCCCC ATACAGCTCT TTTGCCTAAA 
AATCGGGAAA GAATGACAAA AGCACTCGTT TCTACACTTG AAAATGATTG GCTTTCAAAA 
GAAAGCATTA GGGATAAAAT CAAACAAATC CATTTTACAG AGAAAATGTT GCCCGTCCTT 
GAGAAAATGC TTCATTCAGA CTCAGTTAAA AAAGGGGCTG TGTCACTCGT CGTACAAATG 
ATCAGTCATA TCAATCTTGA AAAAATTACC CCTTTTGTTG AAAAAGAAAT AAAGTCTTCT 
TTTTATTCCA TTAAAATGTG CACTGTTCTT CAGTCTGCCA TCAATCAAGC GCTCATTCGT 
GAATATGATG AGAAGGCGTT AGATTATCTT CTTGGCAAGG CAGAAGAATG GATAAGGAAA 
AGTACCACAA AGAATCAACT CGGAAATCTG GCAATACGGG CGCTTGACAA TATAAAGTTA 
GACGGTTTTC TGCAGTTTGC GTTAAAGTCT TTTCAGAATC TATTGAATGA AGAAAAACTC 
GGCAGCATAC TACAAAACTT CCTTCTTAGT GTTGTAAGCA GTTTGCGCCA GACTGATAAT 
CCAAACAGGA AGGCTTTGCT TTTGCATGTT CGTACGGAAT TGAAAAACAT AAAGGACAAT 
AAGGAACTGT TGGAAGAAAT CGAAAATTGG AAGAACCATC TTATTGCTGA TTGGGAGCCA 
GCTGAAAAAA TAACAGGAAT TTTGCAGAAA GCTCAGCAGA AAGCATTGGC CTTTGTTCAA 
GACAGCAAGT TTGTGGATAT GTATCTTCTT CCCTTTTTAA CACGCTTTCT GAACAAACTA 
AAAGAAGATC CAATAAAAAT CAATATCATC GAAAATTGGA TAAAAAAGGG AATTAACAAC 
CTTGTTGAAG AGAACCATTC AAAAATAGGC AAGCTGGTAC AGGAGAATTT GGATAAGCTG 
GATGATGAAA CGCTTATTCA TATGATGGAA AATAAAATCG GAAAAGACCT GCAATGGATT 
CGGGTGAATG GAGCTATTTG CGGTTTTATT ATCGGGATTT TTTTAACGGG AATCAAAGCG 
CTGATTTAA

Protein sequence

MISKKSKQPK KSKRLASFSL VVMGTGFVAT IPFQGSFLGG LLQGGFEAGL VGGLADWFAV 
TALFRHPLGL PIPHTALLPK NRERMTKALV STLENDWLSK ESIRDKIKQI HFTEKMLPVL 
EKMLHSDSVK KGAVSLVVQM ISHINLEKIT PFVEKEIKSS FYSIKMCTVL QSAINQALIR 
EYDEKALDYL LGKAEEWIRK STTKNQLGNL AIRALDNIKL DGFLQFALKS FQNLLNEEKL 
GSILQNFLLS VVSSLRQTDN PNRKALLLHV RTELKNIKDN KELLEEIENW KNHLIADWEP 
AEKITGILQK AQQKALAFVQ DSKFVDMYLL PFLTRFLNKL KEDPIKINII ENWIKKGINN 
LVEENHSKIG KLVQENLDKL DDETLIHMME NKIGKDLQWI RVNGAICGFI IGIFLTGIKA 
LI