Gene GYMC61_2845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_2845
Symbol
ID	8526722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	2904164
End bp	2905483
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	50%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003253903
Protein GI	261420221
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAGG TTTTGGCTGG TTTCTTGTTC TTAGCGCTTG TTGGGCTTGC TGCGGGATGT 
TCAAGTGAAG ATGCTGGACA AGCGGCGGGA GGCAAAACCG AAGTTGTATT TTGGCACTCG 
ATGAGCGGGG ATTTGGAGCC GGTGTTGAAT GATCTTGTGG CGGATTTTAA CCAAACCCAT 
CCGGATATTG AGGTAAAGCC GGTGTTTCAA GGAACATATG AAGAAGCGCT GACGAAATGG 
AATGCGGTAG CGGGGACCAA AGATGCGCCG ACGATCATGC AGACGTTTGA AGTCGGGACA 
AAGCATATGA TCGACAGTGG AAAGATTGTT CCGGTGCAAA CGTGGATCGA TAAAGACAAG 
TATGATGTTT CGCAATGGGA GAAAAACATT GTCAATTATT ATACCGTGAA CGGGCGAATT 
TACTCGATGC CATTTAACTC GTCAACCCCT GTGTTAATTT ATAATAAAGA TGCGTTCCGC 
GAAGCCGGGC TTGATCCGGA AAAGCCGCCG CTGACCTACA GCGAGTTGAA AGAAGCGGCG 
AAAAAGCTGA CAAAGAAAAA AGGGAAGGAA ACCGAACGGT ACGGATTCTC GATTTTGAAC 
TACGGCTGGT TTTTTGAAGA AATGGTGGCC GTACAAGACG GGCTATATGT GAACAACAAC 
AATGGCCGGA GCGGTAATGC AACGAAAGCA GTATTTAATG GAGAGGAAGG GAAACGTGTA 
TTTGAGTTGA TCCGCGACAT GTATCGAGAC GGCACGTTTT ACAACGTCGG CCAAAATTGG 
GACGATATGC GCGCTGCCTT CCAAGCGGGA AAAATCGCCA TGTATTTGGA TTCGTCCGCT 
GGCGTAAAAA CGTTGATCGA CAACTCGCCG TTTGACGTTG GCGTTTCGTA TTTGCCTGTT 
CCGGATGGCG TAGAGCGCCA AGGCGTCGTG ATCGGCGGCG CTTCTCTTTG GATGATGAAA 
GGAAGCAGCG AAGAGGAACA AAAAGCGGCG TGGGAGTTCA TGAAATACTT GACGACTGCT 
CCCGTCCAAG CCGAGTGGCA TGTGCGCACA GGCTATTTCG CCATCAACCC AGCTGCGTAC 
GATGAGCCGC TGGTCAAAGA GGAATGGACG AAATACCCTC AATTAAAAGT GACGGTGGAC 
CAGCTGCATG AAACAAAATC AACCCCTGCC ACCCAAGGAG CGCTCATCAC CGTCTTCCCT 
GAATCTCGGC AACATGTCGT GAAAGCGATG GAACGGTTGT ATGAAGGCAT CGATCCGCAA 
GAAGCGCTCA ATCAAGCAGC GGAAGAAACG AACCAGGCGT TGCAGGGGGC GGCAAATTAG

Protein sequence

MRKVLAGFLF LALVGLAAGC SSEDAGQAAG GKTEVVFWHS MSGDLEPVLN DLVADFNQTH 
PDIEVKPVFQ GTYEEALTKW NAVAGTKDAP TIMQTFEVGT KHMIDSGKIV PVQTWIDKDK 
YDVSQWEKNI VNYYTVNGRI YSMPFNSSTP VLIYNKDAFR EAGLDPEKPP LTYSELKEAA 
KKLTKKKGKE TERYGFSILN YGWFFEEMVA VQDGLYVNNN NGRSGNATKA VFNGEEGKRV 
FELIRDMYRD GTFYNVGQNW DDMRAAFQAG KIAMYLDSSA GVKTLIDNSP FDVGVSYLPV 
PDGVERQGVV IGGASLWMMK GSSEEEQKAA WEFMKYLTTA PVQAEWHVRT GYFAINPAAY 
DEPLVKEEWT KYPQLKVTVD QLHETKSTPA TQGALITVFP ESRQHVVKAM ERLYEGIDPQ 
EALNQAAEET NQALQGAAN