Gene GWCH70_1074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_1074
Symbol
ID	7976996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	1126348
End bp	1128024
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	43%
IMG OID	644798027
Product	Dak phosphatase
Protein accession	YP_002949200
Protein GI	239826576
COG category	[R] General function prediction only
COG ID	[COG1461] Predicted kinase related to dihydroxyacetone kinase
TIGRFAM ID	[TIGR03599] DAK2 domain fusion protein YloV

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0587558
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACAATTA GGATACTTGA CGGAAGACTG TTTGCAGAAA TGGTCTTTCA AGGAGCGGCG 
CATTTATCCA ACAATGCAAA AGCGGTCGAT GCGCTGAACG TCTTTCCGGT TCCGGATGGC 
GATACAGGCA CGAATATGAA TTTATCGATG ACTTCTGGTG CAAAGGAAGT AAAAAATAAT 
ATTTCTGATC ATATTGGAAA AGTCGGCAGC GCATTAGCAA AAGGGCTATT GATGGGAGCA 
CGCGGAAATT CAGGAGTGAT TTTATCGCAA TTGTTTCGTG GTTTTGCGAA AGCGGTGGAA 
GCGAAAAAAG AAATTAATAG TGCGGAATTT GCTGCTGCGC TTGAAGCAGG TGTCACCACC 
GCTTATAAAG CGGTAATGAA GCCGGTGGAA GGCACGATAC TGACCGTAGC GAAAGACGCG 
GCGAAACGGG CGGTAGAAGT CGCAAAAAAA GAACAAGACA TTGCCATTGT GATGGAAGAG 
GCAGTGAAGG AAGCGAAGGC GTCTTTGCAA CGCACACCTG AATTATTGCC GGTATTAAAA 
GAAGTGGGGG TTGTCGATAG CGGCGGTCAA GGGCTTGTCT ACGTATATGA AGGATTTTTG 
AGCGCATTAA AAGGGGAAAA TGTTGCTGAT CGAAAGCCTA TAGAAGTCTC GATGCAAGAA 
TTAATCAATG CTGAACATCA TAAAAGTGCA CAAAGCCATA TCGATACGGA TGAAATTGAG 
TTTGGTTACT GTACCGAATT TATGGTACGG TTTGAACGAG ATAAATTGCA AAAACATCCA 
TTCTCTGAAG AAGCGTTTCG TCAAGATTTA AGCCGATTCG GTGACTCATT ATTAGTCATT 
GCTGATGATG AACTTGTAAA AGTGCATATT CACACAGAAC AGCCTGGCGA AGTACTGACA 
TATGGACAAA AATACGGAAG TTTAATAAAC ATTAAAATTG AAAATATGCG TCAACAGCAC 
GCAAACATAG TAAATCAAGA ACGCAATGCT GCTTCGAGCG CATCAACGGC GAAACAAAAA 
GAGAAATATG GAATTGTGAC AATAGCGATG GGATCCGGCG TTGCCGAGCT GTTTAAAAGC 
ATCGGCGCAC ACGTTGTCAT TGAAGGCGGC CAAACGATGA ACCCGAGCAC GGAGGATATC 
GTAAAAGCAA TTGAAAGCAT TAACGCAGAA ACAGTATTCG TGCTTCCAAA TAATAAAAAC 
ATTATTATGA CAGCACAACA AGCTGCGACC GTCGTCAACC AAAAGGTGAT CGTCATTCCA 
TCGAAAACAG TCCCTCAAGG GATGTCGGCA TTGCTGGCGT TTAATCCATC ACTTTCTGAG 
GAACAAAATG AAAAAGCAAT GACGGTCGCC TTGTCGCGTG TCAAAACAGG ACAAGTTACG 
TTTTCAGTAC GGGATACAAC GATCGATGGG GTGGAGATTG AAAAAGACGA TTATATGGGT 
CTTGCTGATA ATAAAATCGT TGCGGCGGAA AGAGATAAGC TTTCGGTGAC GAAGCAGCTG 
CTTAATACGC TAATTGATGA AGATAGTGAA ATCGTTACAA TGATATATGG GGAAGAAGCA 
ACAGAAGAGG AAGTCGAAGC AATTGTTTCT TATATTGAGG AAACATATCC GGACGTAGAA 
GTGGAAGTGC ATAACGGAAA ACAGCCGTTA TATCCATTTA TCTTTTCTGT TGAATAA

Protein sequence

MTIRILDGRL FAEMVFQGAA HLSNNAKAVD ALNVFPVPDG DTGTNMNLSM TSGAKEVKNN 
ISDHIGKVGS ALAKGLLMGA RGNSGVILSQ LFRGFAKAVE AKKEINSAEF AAALEAGVTT 
AYKAVMKPVE GTILTVAKDA AKRAVEVAKK EQDIAIVMEE AVKEAKASLQ RTPELLPVLK 
EVGVVDSGGQ GLVYVYEGFL SALKGENVAD RKPIEVSMQE LINAEHHKSA QSHIDTDEIE 
FGYCTEFMVR FERDKLQKHP FSEEAFRQDL SRFGDSLLVI ADDELVKVHI HTEQPGEVLT 
YGQKYGSLIN IKIENMRQQH ANIVNQERNA ASSASTAKQK EKYGIVTIAM GSGVAELFKS 
IGAHVVIEGG QTMNPSTEDI VKAIESINAE TVFVLPNNKN IIMTAQQAAT VVNQKVIVIP 
SKTVPQGMSA LLAFNPSLSE EQNEKAMTVA LSRVKTGQVT FSVRDTTIDG VEIEKDDYMG 
LADNKIVAAE RDKLSVTKQL LNTLIDEDSE IVTMIYGEEA TEEEVEAIVS YIEETYPDVE 
VEVHNGKQPL YPFIFSVE