Gene GYMC61_2668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_2668
Symbol
ID	8526545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	2707208
End bp	2708524
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	49%
IMG OID
Product	PTS system, cellobiose-specific IIC subunit
Protein accession	YP_003253738
Protein GI	261420056
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAAG CATTATTCGA AAAACTAAGC AAAGTTCTCA TTCCGATCGC GGGAAAGTTG 
AACAATAGCC GCTATTTGCA AGTGTTGCGC GATGCCTTTA TGTTGGCGTT TCCGTTGACG 
ATTTTCGGTT CAATCGCGGT CGTCATCGCC AACTTGCCGT TTTTGGACAA GGTGATGAGT 
GAAAACAGCC TCAATACACT CAAGGGGATG CTCGGTGTTG CACCAAATGC AACAATGGGC 
GTGATGACGA TTTTCGTCGT GTTTGGCATT GGCTACTATT TATCGAAAAG TTATGAAGTC 
GAAGGGATTT TCGGCGGTGC GATCGCGTTA GCTTCTTTTC TCTTGTTGAC GCCATTCGCT 
TTGCAGGTTG AAGGAGGTGA GGTTGTGCAA GGAGTCATCC CGCTCGACCG CCTAGGAGCG 
AAAGGGATGT TTCTTGGCAT GATTACCGCA TTTGTCGCTG GGGAAATTTA CCGGAAGGTT 
GTGCAAAAAA ATATTACCAT CAAAATGCCG GCCGGGGTGC CGCCGGCGGT TGCGAAGTCG 
TTTGCGGCGT TGATTCCGGC GGTGGTCACC CTGACCTTCT TCCTCGTCGT CAATATCATT 
GTAACACAAA TTTTTAAAAC AAACATGCAT GATGTCATTT ACAACGCAGT GCAAGCACCG 
CTTGTTGGGC TCGGAAGCGG CATTGTTCCA ACGCTCATCG CGATTTTTGT CACGCAAATT 
TTATGGTTTT TTGGCCTCCA CGGGCAAATC ATCATCAACT CGGTGATGGA TCCGATTTGG 
AACACACTGT CGCTCGAAAA CTTAAATGCG TACACGCAAA CAGGGGAAGT TCCGCATGTC 
GTCAGCAAAC AGTTTATTGA AATTTACACG GTCGGCATGG GCGGAACGGG TATGACACTC 
GCTGTCATTT TCGCCATCTT GCTCTTTATG AAGAGCAAGC AAATGAAGCA GGTGGCCAAG 
CTCGGGCTTG GACCGGGAAT CTTTAACGTC AATGAACCGA TTATTTTCGG CTTGCCGGTC 
GTGATGAATC CGCTCGTCAT CGTCCCGTGG ATTTTGGCGC CGATGGTTGT CACGTTGGTG 
ACGTATTTGG CGATGTCCTC AGGCCTTGTC CCGCCGCCTA ACGGCGTAGC GGTACCATGG 
ACGGTGCCGA TTTTCATCAA CGGCATTATG GCGACAAACT CGCTGGCCGG CGGACTGTTG 
CAAGTGGTCA ATTTCTTGAT CGTGCTCGTC ATTTGGTTCC CGTTCTTAAA ATTCATTGAC 
CGCATGAATT TACAAAAGGA AAAAGAAGAG CAAGCCGCAT CGAAAAGTGC ATCATAA

Protein sequence

MNQALFEKLS KVLIPIAGKL NNSRYLQVLR DAFMLAFPLT IFGSIAVVIA NLPFLDKVMS 
ENSLNTLKGM LGVAPNATMG VMTIFVVFGI GYYLSKSYEV EGIFGGAIAL ASFLLLTPFA 
LQVEGGEVVQ GVIPLDRLGA KGMFLGMITA FVAGEIYRKV VQKNITIKMP AGVPPAVAKS 
FAALIPAVVT LTFFLVVNII VTQIFKTNMH DVIYNAVQAP LVGLGSGIVP TLIAIFVTQI 
LWFFGLHGQI IINSVMDPIW NTLSLENLNA YTQTGEVPHV VSKQFIEIYT VGMGGTGMTL 
AVIFAILLFM KSKQMKQVAK LGLGPGIFNV NEPIIFGLPV VMNPLVIVPW ILAPMVVTLV 
TYLAMSSGLV PPPNGVAVPW TVPIFINGIM ATNSLAGGLL QVVNFLIVLV IWFPFLKFID 
RMNLQKEKEE QAASKSAS