Gene GYMC61_2742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_2742
Symbol
ID	8526619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	2794719
End bp	2796344
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	42%
IMG OID
Product	extracellular solute-binding protein family 5
Protein accession	YP_003253806
Protein GI	261420124
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAA GTCTTCTAAC TGTATTGGTG TTGTTGCTAT TCGTTTCAAC GGCGCTTGTC 
GCTTGCAGCA ATGAAACGCC GTCAAATGAA GGAAGTGAGG CGGCCAAGAA TATTAAGCAG 
GAAATTACGT TGAATGCAAA GACTGAGCCG CCTAGCTTAG ACCCTGCAAT CGCATCGGAT 
ACGACGTCGG GATGGGTGAT CGACCACCTA TTTGAAGGAT TGTATACGAA AAATCAAAAA 
GGAGAGCCTG TATTAGGAGC CGCAAGTGAT GTAAAAATAT CAGAAGATGG AAAAACGTAT 
ACGTTTACGA TTCGTGAGGA TGCAAAATGG TCTGACGGTG ATCCAGTCAC GGCCTATGAC 
TTTGAATACG CTTGGAAACG TGTGCTTGAT CCGAAGACAG GGAGCCCGTT CGCTTTTTAT 
ATGTATTACA TCAAGGGGGC CGAAGAATAT AACAAAGGAA AGGGAAGCGC GGATCAGGTA 
GGGATTAAGG CGTTGGATGA CAAAACATTC CAAGTGGAAT TAAAAGCACC GTTGGGATAT 
TTTGATAAAT TGCTGACCAT GTGGACATTT TATCCAGTGA AAAAATCTCT CGTTGAATCG 
AACCCGAAAT GGGCAGCGGA CGCAAAAGGA TATGTAAGCA ACGGGGCTTA TCGTTTGACA 
GAATGGAAGC ATAATAGTGA AGTTGTCATC GAAAAGAATG AACATTATTG GAACAAAGAT 
CAAATTAATA TGCAAAAGGT AACATGGAAG ATGGTCAATG ATGCGACGAC ATACTATCAA 
ATGTATAAAA CAGGGGAGCT TGACTTAATT GACACCTTGC CGACTGACGT CATTGACCAA 
GAAAAAAATA ATAAGGAGTT TAAAATCACT CCATACTTTG GTACGTATAT GTTTATGCTG 
AATGTAGACA AACCACCGTT TACGAACGCA AAAATTCGCC GCGCTTTTGC CATGGCCATT 
GATCGGGAGG CAATTGTCAA AAATATTACC AAATCTGGTG AAAAACCGGC TTATGCCTTC 
GTACCATACG GTGTCAATAC TCCGAAAGGC GATTTCCGAG AAGTGGGCGG TTCTTATTTT 
GAAGAGAACG TCAAAGAAGC GAAACAGTTA TTGGAAGAAG GTATGAAGGA AGAAGGATGG 
ACAAAGCTTC CAGAAGTCAC GCTAATGTAT AATACCGCCG AGAACCATAA AAAAATTGCT 
GAAGCTGTTC AAGAAATGTT GAAAACGAAC CTTGGCGTGA AAGTGAAACT GGCCAACCAA 
GAATGGAAAA CATACTTGGA AACGACACAG CAATCCAATT TCCAAATGGC CCGCATGGGT 
TGGATCGGTG TGTTTGTTGA TCCGACAGTG ATTTTGGATT ACTACTTAGG CGACAGCCCG 
AACAACCGCA CGAACTGGGT AAACAAGCGA TTTGATGATT TGATGGCGAA AGCGAAAGTG 
GAACAAGATG ACCAAAAACG ATATGAACTC CTCCATGAAG CGGAAAAAGT ACTAATGACG 
GATCTGCCGT TTATCCCTGT TTATTTCTAT TCGCAAAATT ATTTAACATC GCCGAATTTT 
AAAGATATTG TCTATCCCGT CAACCGTTAT CCGGACGTGC GCTGGGCGAA AAAAGTAGCA 
GAGTAG

Protein sequence

MKRSLLTVLV LLLFVSTALV ACSNETPSNE GSEAAKNIKQ EITLNAKTEP PSLDPAIASD 
TTSGWVIDHL FEGLYTKNQK GEPVLGAASD VKISEDGKTY TFTIREDAKW SDGDPVTAYD 
FEYAWKRVLD PKTGSPFAFY MYYIKGAEEY NKGKGSADQV GIKALDDKTF QVELKAPLGY 
FDKLLTMWTF YPVKKSLVES NPKWAADAKG YVSNGAYRLT EWKHNSEVVI EKNEHYWNKD 
QINMQKVTWK MVNDATTYYQ MYKTGELDLI DTLPTDVIDQ EKNNKEFKIT PYFGTYMFML 
NVDKPPFTNA KIRRAFAMAI DREAIVKNIT KSGEKPAYAF VPYGVNTPKG DFREVGGSYF 
EENVKEAKQL LEEGMKEEGW TKLPEVTLMY NTAENHKKIA EAVQEMLKTN LGVKVKLANQ 
EWKTYLETTQ QSNFQMARMG WIGVFVDPTV ILDYYLGDSP NNRTNWVNKR FDDLMAKAKV 
EQDDQKRYEL LHEAEKVLMT DLPFIPVYFY SQNYLTSPNF KDIVYPVNRY PDVRWAKKVA 
E