Gene GYMC61_2135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_2135
Symbol
ID	8525999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	+
Start bp	2156960
End bp	2158315
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	52%
IMG OID
Product	PTS system, cellobiose-specific IIC subunit
Protein accession	YP_003253233
Protein GI	261419551
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCGGT TTATTCGTGT GTTGGAAGAG CGTGTGATGC CTGTCGCCGG CAGGATTGCC 
GAACAGCGCC ATTTGCAAGC CATTCGTGAC GGAATCATTT TGTCGATGCC GCTCTTGATT 
ATCGGGTCTT TATTTTTAAT CATTGGTTTT TTGCCGATCC CCGGTTATAA CGAATGGATG 
GCGAAATGGT TTGGCGAACA TTGGCTCGAT AAGCTGTTGT ATCCGGTCGG GGCGACATTC 
GACATTATGG CGCTTGTCGT CAGCTTCGGC GTCGCTTACC GGTTGGCGGA AAAGTACAAA 
GTTGATGCGC TTTCGGCCGG GGCGATTTCA CTTGCCGCTT TTTTGCTCGC AACTCCGTAT 
AAAGTGCCGT TCACGCCGGA AGGAGCGAAA GAAGCCATTA TGGTCAGCGG CGGCATTCCG 
GTGCAATGGG TCGGCAGCAA AGGTTTGTTT GTCGCCATGA TTTTGGCGAT CGCATCGACG 
GAAATTTACC GAAAAATCAT CCAAAAAAAT ATTGTCATTC GACTTCCGGA TGGGGTGCCG 
CCTGCAGTGG CCCGCTCTTT TGTTGCTTTG ATTCCGGGGG CCGCTGTTCT CGTCGTTGTC 
TGGGTGGCCC GCCTTATTTT GGAAATGACG CCGTTTGAAA GTTTCCATAA TATTGTATCT 
GTGCTTCTAA ACAAACCGCT CAGTGTGCTC GGCGGCAGTT TATTTGGCGC CATTGTCGCT 
GTACTGCTTG TGCAGCTGCT ATGGTCGACC GGTTTGCACG GGGCGGCGAT CGTAGGAGGA 
GTAATGGGGC CGATTTGGCT GTCGCTGATG GACGAAAACC GGATGGTGTT CCAGCAAAAT 
CCGAATGCCG AACTGCCCAA CGTCATTACG CAGCAGTTTT TTGATCTTTG GATTTACATC 
GGCGGTTCAG GAGCGACATT GGCGTTGGCG TTGACCATGA TGCTTCGGGC GCGCAGCCGG 
CAGTTGAAAA GCTTAGGGCG GCTCGCGATC GCACCTGGCA TTTTCAATAT TAATGAGCCG 
ATCACGTTCG GTATGCCGAT CGTCATGAAT CCATTGCTTA TCATTCCATT CATTCTCGTG 
CCTGTCGTGC TTGTTGTTGT CTCCTACGCG GCGATGGCGA CTGGGCTTGT CGCCAAACCA 
AGCGGGGTGG CCGTGCCATG GACGACACCG ATCGTGATCA GTGGCTATTT AGCGACGGGG 
GGCAAAATTT CCGGGAGCAT TTTGCAAATC GTCAACTTCT TCATCGCGTT TGCCATCTAC 
TATCCATTTT TCTCGATTTG GGACAAACAA AAAGCGGCCG AAGAGCAGAC CGATCCAACA 
ATCTCAAGCG GAGCGGGAAC AACGCACTCG CTGTAA

Protein sequence

MDRFIRVLEE RVMPVAGRIA EQRHLQAIRD GIILSMPLLI IGSLFLIIGF LPIPGYNEWM 
AKWFGEHWLD KLLYPVGATF DIMALVVSFG VAYRLAEKYK VDALSAGAIS LAAFLLATPY 
KVPFTPEGAK EAIMVSGGIP VQWVGSKGLF VAMILAIAST EIYRKIIQKN IVIRLPDGVP 
PAVARSFVAL IPGAAVLVVV WVARLILEMT PFESFHNIVS VLLNKPLSVL GGSLFGAIVA 
VLLVQLLWST GLHGAAIVGG VMGPIWLSLM DENRMVFQQN PNAELPNVIT QQFFDLWIYI 
GGSGATLALA LTMMLRARSR QLKSLGRLAI APGIFNINEP ITFGMPIVMN PLLIIPFILV 
PVVLVVVSYA AMATGLVAKP SGVAVPWTTP IVISGYLATG GKISGSILQI VNFFIAFAIY 
YPFFSIWDKQ KAAEEQTDPT ISSGAGTTHS L