Gene GYMC61_2731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_2731
Symbol
ID	8526608
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	2781619
End bp	2782983
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	42%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003253795
Protein GI	261420113
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAGGA CGAAAAAAAT GAAAACGCTT TTTCTTGCTC TAGCGTTTGC CGTGATTTCT 
GCTTTAGTAG GGTGTTCGGA CAAAAACGCA TCTGTCGGCA ATGGCAATGG GGAAAAAATA 
GAACTGACGT TTATGTTTAG GGGACAGCCC CAAGAGCAAA CAGCTTATAA GAACGTAGTG 
AAAAAATTCG AAGAAAAACA TCCGAATGTA AAAGTAAATA TTGTTGTTAC GTCGCCAGAT 
CAATATGCTA CGAAACTACG GGCTGCGATC GCGGGAAGAA AAATACCTGA TGTGTTTTAT 
TTCAACCCCG GAGAACTTCG CGCTTATGTG AATTCCAATG TACTATTAGA CATCACAAAA 
TATGTAGAAA ACTCAAAAGG TGTTAATCTC CAAGATATTT GGGAAAAAGG GGTAAATAAA 
TATCGATTTG ATGGAGAAAA GGTCGGTCAG GGAAATCTTT ATGGGCTGCC GAAAGATTTA 
GGACCGTTTG CACTCGGGTA CAATAAAACA ATGTTTGAAA AAGCAGGGAT TCCTCTTCCA 
GATAAAGATA AACCATATAC ATGGCAAGAA TTTATTGATG TTTGTAAGAA ACTAACCAAA 
GACACGAATG GCGATGGGAA GCTCGACCAA TGGGGAACAG GTTTAAATGC CACATGGACG 
TTGCAAGCGT TTGTTTGGAG CAATGGTGCC GATTGGATTG ATGAAAGCAA AACGAAAGTT 
ACCGTTGACG ATCCGAAATT TATAGAAGCC CTCCAATTCT TTGCTGACAT GCAGAATAAA 
TATAAGGTCA CCCCATCGAT TGCGGAGGCG CAGACATTGG ATACGTATCA ACGCTGGTTG 
AGAGGGCAAC TTGGCTTTTT CCCTGTAGGT CCTTGGGATT TAGCTGCTTT TGACCAACAA 
ATCAAATTTG AGTATGATTT GATTCCATGG CCTGCAGGTT CGACTGGCAA ACCGGCTACT 
TGGGTTGGGT CGCTTGGAAT CGGGGTGTCA AGCATGACCA AGCATCCAAA AGAGGCAGTA 
GAGTTAGCAT TATATTTGTC CGCTGATCCA GAGGGGCAGA AAGCGCTTGT TGACCAGCGT 
GTACAGTTGC CGAACTCTGT GAAAGTAGCT GAAGAGTGGG CAAAAGATCC TTCCATTAAG 
CCGGCAAACA AGCAGGAATT TTTGGATATC ATTAATGATT ATGGGCGTTC ATTTCCGACA 
GAATATACGT ACAACGGTGA ATGGTACGAC GAGTTTTATC GCAATCTGCA ACCAGTTTTA 
GATGGAAAAA TGTCCGCTGA AGAGTACGTA AAGAAAGCAA AGCCGAAAAT GCAAAAGCTG 
TTGGATCAGG CAATCGAACA AGAAAAACAA GCAAGCAAAA AATGA

Protein sequence

MMRTKKMKTL FLALAFAVIS ALVGCSDKNA SVGNGNGEKI ELTFMFRGQP QEQTAYKNVV 
KKFEEKHPNV KVNIVVTSPD QYATKLRAAI AGRKIPDVFY FNPGELRAYV NSNVLLDITK 
YVENSKGVNL QDIWEKGVNK YRFDGEKVGQ GNLYGLPKDL GPFALGYNKT MFEKAGIPLP 
DKDKPYTWQE FIDVCKKLTK DTNGDGKLDQ WGTGLNATWT LQAFVWSNGA DWIDESKTKV 
TVDDPKFIEA LQFFADMQNK YKVTPSIAEA QTLDTYQRWL RGQLGFFPVG PWDLAAFDQQ 
IKFEYDLIPW PAGSTGKPAT WVGSLGIGVS SMTKHPKEAV ELALYLSADP EGQKALVDQR 
VQLPNSVKVA EEWAKDPSIK PANKQEFLDI INDYGRSFPT EYTYNGEWYD EFYRNLQPVL 
DGKMSAEEYV KKAKPKMQKL LDQAIEQEKQ ASKK