Gene GWCH70_0082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_0082
Symbol
ID	7978533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	106707
End bp	107795
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	39%
IMG OID	644797056
Product	ATP:guanido phosphotransferase
Protein accession	YP_002948288
Protein GI	239825664
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3869] Arginine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000334735
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTTTG AGAAGTTTTT TAATACGGCG GTCAGTTCTT GGATGAGTCA AGAGGGGCCT 
GATTCTGATA TCGTGTTAAG CAGCCGTATC CGTTTAGCAA GAAACATTGT TGATTTTCAG 
TTTCCAACAG TATTTAACAA TGAGGAAGCA CAGCAAATTG TTTCATTGTT TGAGCAAACA 
TTTGCTCATC GTTTTTACCC GTCTGTCGGT CGTTTTGAAT TGTTAAAAAT GTCAGAGCTT 
CAACCGATTG AAAAAAGGGT ATTGGTAGAA AAGCATTTAA TTAGCCCGCA TTTGGCAGAA 
GATTCTCCTT TTGGGGCGTG CTTGCTTTCA GAAAATGAAG AAATAAGCAT TATGATTAAT 
GAAGAGGATC ACATTCGTAT TCAATGTTTA TTTCCTGGTC TTCAATTAAC AGAAGCGTTA 
AAAGTGGCTA ATGAGCTTGA TGATTGGATT GAGGAACATG TCAATTATGC GTTTGATGAA 
AAACTCGGAT ATTTAACAAG CTGTCCGACA AACGTTGGAA CAGGGATGCG CGCTTCTGTT 
ATGATGCATC TCCCGGCTCT CGTTTTAACA CAGCAAATAA ACCGCATTAT TCCAGCAATC 
AACCAACTAG GATTAGTAGT ACGCGGAACA TATGGAGAAG GCAGTGAGGC GTTAGGTAAC 
ATTTTCCAAA TTTCAAATCA AATTACATTA GGAAAGTCGG AAGAGGATAT TGTGGAAGAT 
TTGAAAAGCG TTGTTCAACA ATTAATTGCC CAGGAAAGAA TGGCGAGGGA GACATTAGTC 
AAAACTTTAA ACATACAATT AGAAGACAGA GTATTCCGTT CTTATGGGAT ATTAGCAAAT 
AGCCGTGTTA TTGAATCTAA AGAAGCAGCG CAATGTTTGT CTGATGTACG TTTAGGAATT 
GACTTAGGAT ATATTAAAAA TATTTCGCGC AATATTTTAA ATGAGCTGAT GATTTTAACT 
CAACCTGGAT TTTTACAACA GTATGCAGGC GGCGTGCTAA GACCGGAAGA ACGGGATGTT 
CGACGGGCGG CACTAATCCG CGAACGTCTA AAAATGGAAG AAAGAAAAGC GATGGAGGGT 
GATGAATAA

Protein sequence

MSFEKFFNTA VSSWMSQEGP DSDIVLSSRI RLARNIVDFQ FPTVFNNEEA QQIVSLFEQT 
FAHRFYPSVG RFELLKMSEL QPIEKRVLVE KHLISPHLAE DSPFGACLLS ENEEISIMIN 
EEDHIRIQCL FPGLQLTEAL KVANELDDWI EEHVNYAFDE KLGYLTSCPT NVGTGMRASV 
MMHLPALVLT QQINRIIPAI NQLGLVVRGT YGEGSEALGN IFQISNQITL GKSEEDIVED 
LKSVVQQLIA QERMARETLV KTLNIQLEDR VFRSYGILAN SRVIESKEAA QCLSDVRLGI 
DLGYIKNISR NILNELMILT QPGFLQQYAG GVLRPEERDV RRAALIRERL KMEERKAMEG 
DE