Gene GWCH70_3176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_3176
Symbol
ID	7977029
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	3204852
End bp	3206081
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	50%
IMG OID	644799961
Product	allantoate amidohydrolase
Protein accession	YP_002951100
Protein GI	239828476
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.183247
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATTAATG CAGATCGGCT TTGGAATCGG CTCATGGAAT TAGGAGAGAT TGGAAAACAG 
CCGTCAGGCG GAATTACTCG TTTATCGTTT ACAAAAGAAG AACGTGCCGC AAAGGAAAAA 
GTAGCTTCGT ATATGAAGGA AGCAGGGCTT GCCGTGTATG AAGATGCGGT TGGAAATTTG 
CTTGGACGTA AAGAAGGAAA AGATCCGGAG GCCGCTGTCG TGCTGGTCGG TTCGCACTTA 
GACTCCGTCT ATAACGGAGG AATGTTTGAC GGTCCGCTCG GAGTGCTTTC CGCGGTGGAA 
GTGTTACAAA CGATGAACGA ACGAGGGGTG GAAACGAAGC ATCCGATTGA AGTCGTTGCT 
TTTACCGATG AAGAAGGAGC ACGCTTTAGT TACGGTATGA TCGGCAGCCG TGGAATGGCG 
GGAACATTGT CGGAGGAAGA ACTCGTTCAT CAAGATAAAC ATGGAATTTC GATTGCCGAA 
GCGATGAAAG CAGCGGGGCT TGACCCCAGT GAAATAGGCA AGGCTGCGCG GCGAAAAGGA 
TCAGTAAAAG CTTATGTCGA GTTACATATT GAACAAGGGC GTGTTTTGGA ACAAGCGAAT 
CTTCCTGTCG GAATTGTCAC AGGGATCGCC GGGCTTGTAT GGGCGAAATT TACGGTGGAA 
GGAAAAGCGG AACATGCCGG GGCAACGCCA ATGCCAATCC GGCGCGATCC GCTTGTTGCC 
GCAGCACAGA TCATCCAAAT GATCGAACAA GAGGCGAAAA AGACAGGAAC CACCGTGGGA 
ACCGTTGGGC AAATGCAGGT GTTCCCGGGA GGAATTAACG TCATTCCGGC ACGAGTCGAA 
TTTTCCTTAG ATTTGCGGGA TATTGACGCG GCAGTGCGCG ATAACGTATT CCAGTCGATT 
ATTGAACGAG CGCAACAAAT TGGCCAAGAG AGAAATGTAA AGGTCACTGT CGAGCGGCTG 
CAAGAGATGC CTCCGGTATT ATGTTCCGAA CTTGTGCAAA ATGCAGCGAA GGAAGCGTGT 
AAACAACTAG GTTTTGATGT GTTCTCCCTT CCTAGCGGCG CTGCCCATGA CGGGGTGCAG 
CTCGTGGATC TTTGCCCGAT CGGGATGATT TTTGTCCGCT CGAAAGATGG GATCAGCCAT 
AGCCCGGAGG AATGGAGTTC AAAGGAAGAT TGTGCGGCCG GTGCGAACGT ATTGTACCAT 
ACCGTATTGC GTTTAGCGAT GGGAGAATAA

Protein sequence

MINADRLWNR LMELGEIGKQ PSGGITRLSF TKEERAAKEK VASYMKEAGL AVYEDAVGNL 
LGRKEGKDPE AAVVLVGSHL DSVYNGGMFD GPLGVLSAVE VLQTMNERGV ETKHPIEVVA 
FTDEEGARFS YGMIGSRGMA GTLSEEELVH QDKHGISIAE AMKAAGLDPS EIGKAARRKG 
SVKAYVELHI EQGRVLEQAN LPVGIVTGIA GLVWAKFTVE GKAEHAGATP MPIRRDPLVA 
AAQIIQMIEQ EAKKTGTTVG TVGQMQVFPG GINVIPARVE FSLDLRDIDA AVRDNVFQSI 
IERAQQIGQE RNVKVTVERL QEMPPVLCSE LVQNAAKEAC KQLGFDVFSL PSGAAHDGVQ 
LVDLCPIGMI FVRSKDGISH SPEEWSSKED CAAGANVLYH TVLRLAMGE