Gene GYMC61_1727 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_1727
Symbol
ID	8525591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	+
Start bp	1751213
End bp	1752481
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	48%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003252836
Protein GI	261419154
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAAAA CAAAGTGGAT GGCAGCGCTA GGCATCACAA CGATGCTGTT TGGCAGCCTT 
TTGGCCGGTT GCGGCGGTGG TGAGAAAAGT GAGAAGGCAA ACGGGGGGAG TAAGCAAGGC 
GAGAAAGTAG AAGTCACGTT AGCTGGCTGG GGCGGCAACC CAACGGAGCA AAAGTTGTTG 
AAACAAACGC TTGACGATTT TGAGAAAAAA CACCCTAATA TTAAGGTCAA GTATGAAGTC 
ATTGCCGACC AGTATATGGA TGTCATCAAA ACCCGTTTAG CGGGTGGGCA AGGGCCGGAT 
GTGTTTTACC TTGATGCATT TGAAGCCCCA GCTCTGATTG AAACAGGGGC GCTTGAGCCG 
CTTGACAAAT ATGTAACGGA CGATTTTGAC ATTAACGATT TTGAAAAGCC GATGCTTGAT 
GCGTTTAAAG GGAAAGACGG GAAAATTTAC GGATTCCCGA AAGACTATTC GACGCTAGCA 
CTGTTTTACA ATAAAAAGAT GTTCGAAGAA GCAGGCGTTG AAGTCCCAAA AACTTGGGAT 
GAACTGCGGG AAGTGGCGAA AAAGCTGACA AAAGGGAAGC AAGTATACGG ATTTGGCGTT 
GCACCGGAAC TGGCTCGCTT ATACTACATT GCTGAATCCA AAGGCGGCAA AGTTGTGACG 
GATAATAAAG CGAGCTTTGC CGATCCGAAA GTCGTCGAGG CGCTCCAGCC GATCGTTGAT 
ATGCACTTAA AAGATAAGTC GGCGGCCCAA CCGAATGAAG TTGGGGCGAC ATGGGGCGGC 
GAGATGTTCG GGCAAGGCAA AGCTGCTATG GTGATTGAAG GGAACTGGGC GATTCCATTT 
TTACAAGACA CGTTCCCGAA TTTAGAATTC GGTACAGCGG AAGTTCCAAT GATCAATGGC 
AAAAAGGCGA CGATGGCGTA CACAGTGGCT TATGTCATGA ACAAAGACTC GAAAAAGAAA 
GAAGCGGCTT GGGAGCTCAT CTCGTATTTG ACTGGCAAAG AAGGCATGAA AACATGGACG 
AGCAAGGGGT ATGCTTTGCC GACGCGGAAA TCGGTCGCTG CTGAATTGGG ATTTGACAAA 
GATCCGTTGC GGGCGCCATT AGTCGCTGGA GCATCGTATG CAACTGTATG GCAAAACGGA 
ACGAACTTGC CGATTATTAT GAACAACTTC AATAACCAAT TTGTCAGCGC TTTCCTCGGT 
GAACGTCCGC TTGCTGAGGC ATTGAAAGAA GCGCAAAAAA CGGCGAATAG CGAAATCGAG 
AGCAAATAA

Protein sequence

MGKTKWMAAL GITTMLFGSL LAGCGGGEKS EKANGGSKQG EKVEVTLAGW GGNPTEQKLL 
KQTLDDFEKK HPNIKVKYEV IADQYMDVIK TRLAGGQGPD VFYLDAFEAP ALIETGALEP 
LDKYVTDDFD INDFEKPMLD AFKGKDGKIY GFPKDYSTLA LFYNKKMFEE AGVEVPKTWD 
ELREVAKKLT KGKQVYGFGV APELARLYYI AESKGGKVVT DNKASFADPK VVEALQPIVD 
MHLKDKSAAQ PNEVGATWGG EMFGQGKAAM VIEGNWAIPF LQDTFPNLEF GTAEVPMING 
KKATMAYTVA YVMNKDSKKK EAAWELISYL TGKEGMKTWT SKGYALPTRK SVAAELGFDK 
DPLRAPLVAG ASYATVWQNG TNLPIIMNNF NNQFVSAFLG ERPLAEALKE AQKTANSEIE 
SK