Gene GYMC61_1352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_1352
Symbol
ID	8525191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	+
Start bp	1373391
End bp	1374995
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	51%
IMG OID
Product	extracellular solute-binding protein family 5
Protein accession	YP_003252480
Protein GI	261418798
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGAAGA AAACATGGTT TACGTGGCTT GCCATGATGC TGGCAGTCAT GCTTGTTTTA 
GCTGGCTGCG GCAAGTCGAA GCAAACCGCA GGGGGTGGCA GTGACAAACC GTCGACCCAG 
GATACGCTGG TGTACGGGCG CGGCGGTGAT TCGGTGTCGC TCGACCCGGC GACTGTGACG 
GATGGGGAGT CGCTGAAAGT AACGAAAAAC ATTTTTGATA CGCTCCTTGA TTACAATGAC 
AACGATACGT CCGTCAAGCC GGCGTTGGCG ACGGAATGGA CGATTTCGAA GGATGGACTG 
ACCTATACGT TTAAATTGCG CCAAGGTGTC AAGTTTCATG ACGGGACAGA GTTTAACGCC 
GATGCAGTGG TCTTTAACTT CGAGCGTTGG GCGAACGGCA ATGCCGACAA GTTTCCGTAT 
TACGGATCGA TGTTTGGCGG TTACAAGCAG GATGACAGCC ATGTGATTAA AGAAGTAAAG 
GCGCTCGACA AGTACACGGT GCAATTTGTG CTGAAACGGC CGCAAGCTCC ATTTTTGAAA 
AATCTCGCCA TGACGCCGTT TGCCATCGCC AGCCCAGAAG CCGTGAAAAA ATACGGCGAC 
AAGTTTGGCG AACACCCAGT CGGGACCGGC CCGTTCGTCT TTAAAGAATG GAAGCGCAAC 
GAACGGATCG TACTTGAAAA AAATAAAGAC TATTGGGAAA AAGGCTATCC AAAGCTGAAC 
CAGCTCATCT TCGTGTCCAT TCCGGACAAC TCGGCGCGTC TCAATGCGCT CTTAAAAGGC 
GAAATCGACA TCATGGAAGA CTTGAATCCG ACGGACTTAA AACAAGTGGA GGGAAACAAA 
GAGTTTCAAA TTTTCAAGCG CCCGTCGATG AACGTCGCCT ATGTCGGACT GACGGCGACG 
AGAGGGCCGC TGAAAAACAA GTTGGTTCGC CAAGCGTTGA ACTACGCGGT TGATAAGAAA 
GCGATCATCG ATGCGTTTTA CGCCGGCCAG GCGGAACCGG CGAAAAACCC GATGCCGCCC 
AGCATCCCGG GATACAACGA TGCGATTCAA GACTATCCGT TTGATTTGAA TAAAGCGAAA 
GAGCTGCTGG CGAAAGCGGG TTATCCGAAT GGCTTTGAAA TCGAACTGTG GGCGATGCCG 
GTGCCGCGTC CGTATATGCC GGACGGGCAA AAAATCGCTG AGGCCATTCA AGCGAATTTT 
GCCAAAATCG GCGTGAAAGC GAAAATCGTG ACGTATGAAT GGGCGACCTA TTTAGACAAG 
CTCGCCAAAG GGGAAGCGGA CGCCTTCCTG CTCGGCTGGA CGGGCGACAA CGGCGACGCG 
GATAACTTCT TGTATGCGCT CCTTGACAAA GACAGCATTG GCAGCAACAA CTACACCTAT 
TTCTCGAATG ATGAGCTGCA TAAAATTTTG GTCGAAGCGC AAACGGTGAG CGATGAAAAC 
AAACGGAACG AGCTGTATAA AAAAGCGCAA GAGATCATTA AAGAAGAAGC GCCATGGATT 
CCGCTCGTCC ATTCAACTCC GCTGTTGGCC GGCAAGGCGA ATATCCAAGG CTTTAACCCG 
CACCCGACCG GTTCGGATAA GTTTACGAAA GTCGAGTTTA AATAA

Protein sequence

MRKKTWFTWL AMMLAVMLVL AGCGKSKQTA GGGSDKPSTQ DTLVYGRGGD SVSLDPATVT 
DGESLKVTKN IFDTLLDYND NDTSVKPALA TEWTISKDGL TYTFKLRQGV KFHDGTEFNA 
DAVVFNFERW ANGNADKFPY YGSMFGGYKQ DDSHVIKEVK ALDKYTVQFV LKRPQAPFLK 
NLAMTPFAIA SPEAVKKYGD KFGEHPVGTG PFVFKEWKRN ERIVLEKNKD YWEKGYPKLN 
QLIFVSIPDN SARLNALLKG EIDIMEDLNP TDLKQVEGNK EFQIFKRPSM NVAYVGLTAT 
RGPLKNKLVR QALNYAVDKK AIIDAFYAGQ AEPAKNPMPP SIPGYNDAIQ DYPFDLNKAK 
ELLAKAGYPN GFEIELWAMP VPRPYMPDGQ KIAEAIQANF AKIGVKAKIV TYEWATYLDK 
LAKGEADAFL LGWTGDNGDA DNFLYALLDK DSIGSNNYTY FSNDELHKIL VEAQTVSDEN 
KRNELYKKAQ EIIKEEAPWI PLVHSTPLLA GKANIQGFNP HPTGSDKFTK VEFK