Gene GYMC61_0050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_0050
Symbol
ID	8523832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	+
Start bp	62180
End bp	63730
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	58%
IMG OID
Product	polysaccharide biosynthesis protein
Protein accession	YP_003251232
Protein GI	261417550
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAACG TATGGAAAGG GGCGGCGATC TTAACGGCCG CCGCTTTGGC CGCGAAACTA 
TTAAGCGCTT TGTACCGTGT TCCGTATCAA AATATGGTCG GGGACATTGG TTTTTATATT 
TACCAACAAG TGTACCCGAT TTATGGCATC GTCGTCGCAC TCTCGCTGAC CGGCTACCCG 
GTTGCCGTCT CGAAGCTTGT CGCCGAGCGG TTGGCGGGAC AGGATGAAGC GGGCGCTGCC 
GCTAGTGTGC GCGTCGCCTT GTTGGTGTTA AGCGTCCTTG GCGTCATCCT GTTTGCTTCG 
CTGTATCTAG GGGCGGGGGT GATTGCCTCG GCGATGGGCG ATGGACGGCT TACGCCGCTC 
GTGCGTTTGC TTTCATTTTC GTTTTTGCTG TTTCCGCCCA TCGCGTTGTT GCGTGGCTAT 
TTCCAAGGGC GGCATGATAT GACGCCGACG GCGGCGTCCC AAGTTGGCGA GCAATTCGTC 
CGGGTGACGG CGATTTTAGG GCTGTCGTAT GGAGCGGTGC AGCGCGGCGC CGACGTCTAT 
GCTTGCGGCA TGGCAGCGGT CGCAGGGACG CTAGTAGGCA TGGCGGCGGC GCTTTTCATT 
TTGCTTTTCT TCCTGTCCCG GCGTCGGCGG CTAAAAACGT CGGGCCGCAC GCCGCCAGCT 
TGGGATCGAC AGGTGGGCCG GCGTTTATTG ACGGAGGGGA CGGTCATTTG CTTGACGAAT 
ATGGCGTTGA CGCTGATTCC ACTCGTCGAT TCATTTTTAT TCGTTCCGCT TCTACAGGAA 
GCGGGGGCAA GGCTCGATGA GGTGCAGCGG CTAAAAGGAG TGTACGACCG CGGTCAGCCG 
CTCATTCAGC TCGGCACGGT CGTCGGCACG TCGTTTTCAT TGGCGCTTGT TCCACTTCTT 
TCCGGAGCGC GCCGCCAAGG TGCCGTTTTC GCCTATGGAG CGCTGTCCAT CCGGCTTGCC 
GTTGTCATTG GGCTTGGTGC TTCGTTAGGG CTCATTTGCC TCATTCGACC GATCAATGCG 
ATGTTGTTCG AGAATGACTA CGGTTCGTCG GTTCTCGCCG TCTTGTCCTC CTCTGTCTTT 
TTTACGACGA TCGCGTTGAC CGCCTCTGCA TTATTGCAAG GAATGGGGAG GGAATGGACG 
GCCGCTGCCG GCGTGGCGTT GGCAGTGGCG GGGAAGGCCG CGCTTATGCA TTGGCTTGCT 
CCGCGGTTTG GAGCGCTTGG CGCCGCCGCG GCGACGACGG GTGCTTATGC GCTCATGGCA 
GGCTTTTTAT GCGCCTTTTT GCCGCGTGAA TATCGGACGG CGGGCCGGAA ATACATGTAC 
CCAACCGTGA AAGCGGCCGC TATGATGGCC GTCGTCTTGC ATGGGTATAG GTGGCTGATG 
GACAGCTCGA GCGAGGGGCG GCTATGGGCG GCTGCCGAGG CGCTTGGCGG CGTTGCCATC 
GGTGCTGTCG TTTACCTTGC GTGTATTGTG AAAGGACATG TTTTTTCTGA ACAGGAGTTG 
GCAGCTCTCC CATTGGCTAA TAAATTCCGT CTACGATTAG GAGGCAGGTG A

Protein sequence

MGNVWKGAAI LTAAALAAKL LSALYRVPYQ NMVGDIGFYI YQQVYPIYGI VVALSLTGYP 
VAVSKLVAER LAGQDEAGAA ASVRVALLVL SVLGVILFAS LYLGAGVIAS AMGDGRLTPL 
VRLLSFSFLL FPPIALLRGY FQGRHDMTPT AASQVGEQFV RVTAILGLSY GAVQRGADVY 
ACGMAAVAGT LVGMAAALFI LLFFLSRRRR LKTSGRTPPA WDRQVGRRLL TEGTVICLTN 
MALTLIPLVD SFLFVPLLQE AGARLDEVQR LKGVYDRGQP LIQLGTVVGT SFSLALVPLL 
SGARRQGAVF AYGALSIRLA VVIGLGASLG LICLIRPINA MLFENDYGSS VLAVLSSSVF 
FTTIALTASA LLQGMGREWT AAAGVALAVA GKAALMHWLA PRFGALGAAA ATTGAYALMA 
GFLCAFLPRE YRTAGRKYMY PTVKAAAMMA VVLHGYRWLM DSSSEGRLWA AAEALGGVAI 
GAVVYLACIV KGHVFSEQEL AALPLANKFR LRLGGR