Gene GWCH70_1279 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_1279
Symbol
ID	7976060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	1327851
End bp	1328828
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	51%
IMG OID	644798223
Product	formiminoglutamase
Protein accession	YP_002949396
Protein GI	239826772
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01227] formimidoylglutamase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACAAAC AGCCGGACAA GGAGAAATGG ACGGGACGGA TCGACAGCGA AAGCGATGAG 
AAAAGTTTTC GCGTCCATCA AAAAATTCGT CTGCTTGATA TAGGACAAAT ACAGACGCAG 
GCAGAAAATG CATTTGCTTT ATTAGGCTTT CAATGTGATG AAGGAGTCCG CCGCAATCAA 
GGACGGCAAG GAGCGTATCA CGCGCCGGTG GAAGTGAAAA AAGCGCTGGC GAACCTGCCA 
TGGCACCTGC CGTCTCACAC AATACTTTAC GATGTGGGCG AAATTACTTG TGAAGGGGGA 
GAGTTAGAAA ACAGCCAGAA ACATTTGGGT CAGGCGGTAG AGCGCCTTAT CTGCCATAAC 
ATCACGCCGG TTGTCATCGG CGGCGGACAT GAAACCGCGT ACGGGCATTA TCTCGGTGTT 
CGTCAGGCGG TCGGTTCGGA AACGAAGCTT GGCATTATCA ATATTGACGC TCATTTTGAC 
ATGCGCCCAT ATGAACAAGG GCCGTCGTCG GGGACAATGT TTCGGCAAAT ATTAGATGAA 
GATGGAAACG TGGGATACTG CTGCCTCGGC ATTCAACCGC TAGGCAACAC GGCGGCGTTA 
TTTGAAACCG CTAATCGATA TGGATGCACG TACGTGCTTG AGGAAGAATT GACGTTGGCA 
ACGCTAGAGC GCGCGTATGA GATCATTGAC GATTTTATCC AAAACTATGA TGTACTGATG 
CTGACGCTTT GCATGGATGT GTTGAGTGCA AGCGCGGCAC CGGGAGTGAG CGCGCCTTCG 
CCGTTCGGGC TTGATCCGAA AATCGTCCGC GCCTTGCTTC GTTATATTAT TTCCAAGCCA 
CAAACGATCA GTTTCGATAT TTGTGAAGTG AATCCGTTGG TCGATGAAAA TCGAAAAACG 
ATTGCGTTAG CGGCCGCCTT CTGCATGGAA GCGCTCGTTC ATTTCCACCG CCGCCAGCGG 
GCGGCGACAG GTCGGTGA

Protein sequence

MYKQPDKEKW TGRIDSESDE KSFRVHQKIR LLDIGQIQTQ AENAFALLGF QCDEGVRRNQ 
GRQGAYHAPV EVKKALANLP WHLPSHTILY DVGEITCEGG ELENSQKHLG QAVERLICHN 
ITPVVIGGGH ETAYGHYLGV RQAVGSETKL GIINIDAHFD MRPYEQGPSS GTMFRQILDE 
DGNVGYCCLG IQPLGNTAAL FETANRYGCT YVLEEELTLA TLERAYEIID DFIQNYDVLM 
LTLCMDVLSA SAAPGVSAPS PFGLDPKIVR ALLRYIISKP QTISFDICEV NPLVDENRKT 
IALAAAFCME ALVHFHRRQR AATGR