Gene GYMC61_0066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_0066
Symbol
ID	8523850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	+
Start bp	79152
End bp	80573
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	57%
IMG OID
Product	Anthranilate synthase
Protein accession	YP_003251248
Protein GI	261417566
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAGC GGCGCAGGCG ACTGAAACGA ACTATCGATT ATCGCGGACG GGATTGGTTC 
CGCCAGTACG AACAGCTGGC CTATAGCCGG CCTCATCATG TGTTGCTTGA GAGCGGCCAA 
GGGGGAAGGT ACAGCATTAT CGGCCTTGAC CCGATCGGAG TGATCCGCGC TGACGAGCGG 
CGGCTCATCA TCAAGCAGCG CGGGGTTGAA ACGGTGCTGG ATGGCTCGCC GCTCGAAGGG 
CTCCGGCAAT GGCTTCGGTG TTTCGCCGTG CCGGATGAGG GGGAGTCGTT GCCTTGCCAA 
GGCGGGCTGA TCGGTTTCAT TAGCTATGAT GCGGTTCGCT ATCTGGAACG GCTCCCGGTG 
CTCGCGCAAG ATGATTTGCG GCTGCCGCTC ATGTATTTTT TCCTCTTTGA CGACGTAGCG 
ATTTATGATC ACCAAACTGA ACAGCTTCAT TTGCTTGCCT ACGCGAATGA AGGGGAGGAA 
AGCGAAGCAA ACCGGCGGCT TGCGCGGCAT GCACGGATGT GGCTCGAGGA TCGGAATGAA 
GCGCTGGTCT GGCCGCTTGC TGCCTCGACA GCTGCGCCGT CTGTTTCAAT GACAAAAGAG 
AGGTTTATGG ATGCGGTTCG CCGCGTGCAA CGCTATATTG CGGCGGGCGA TGTGTTTCAA 
GTCAACTTAT CGGTGCGTCA GTCGCAGCCG CTGGTGACGC ATCCATTTGC CGTCTACAAG 
CAGTTGCGGA TGCTGAATCC GTCCCCTTAC ATGGCGTATT TGCATACCCC GGAATTTCAA 
GTCGTCAGCG GCTCGCCGGA GTTGCTCGTC CGCAAGCGGG GATGGCGTCT TGAGACGCGG 
CCGATTGCCG GCACACGTTC GCGCGGTCGG ACGGCGGCAG AGGATGAACA AATTGCTCGC 
AAGTTGCTTG CGAGTGAAAA GGAGCGGGCC GAGCACGCCA TGCTCGTTGA TCTTGAACGG 
AATGACCTTG GGCGCGTCTG TGCATACGGG ACGGTTCGAG TTGACGAATG GATGACCGTC 
GAAAAGTATT CTCATGTGAT GCATATCGTT TCTCACGTAT CCGGCACCAT GACGACGGAG 
CACGATGCGT TTTCCGTCAT TCGCGCCATG TTTCCCGGCG GGACGATCAC CGGCGCTCCG 
AAAGTGCGAA CAATGGAAAT TATTGAAGAG TTGGAACCGG TCCGCCGCGG CTTGTACACG 
GGCTCGATCG GTTGGATCGA TTTTCAAGGA AACATGGAGC TAAACATCGC CATTCGAACG 
ATGGTCGTCA AAGACGGATT GGCGCATGTA CAGGCAGGAG CGGGCATCGT CATCGATTCC 
AACCCAGAGC ATGAGTACAA GGAATGTTTA AAGAAAGCGG CTGCCCTTTG GAAAGCGAAA 
GAGCTGAGCG AAGCAGAGGC ATTATTTCCG AGCACGAGGT GA

Protein sequence

MEQRRRRLKR TIDYRGRDWF RQYEQLAYSR PHHVLLESGQ GGRYSIIGLD PIGVIRADER 
RLIIKQRGVE TVLDGSPLEG LRQWLRCFAV PDEGESLPCQ GGLIGFISYD AVRYLERLPV 
LAQDDLRLPL MYFFLFDDVA IYDHQTEQLH LLAYANEGEE SEANRRLARH ARMWLEDRNE 
ALVWPLAAST AAPSVSMTKE RFMDAVRRVQ RYIAAGDVFQ VNLSVRQSQP LVTHPFAVYK 
QLRMLNPSPY MAYLHTPEFQ VVSGSPELLV RKRGWRLETR PIAGTRSRGR TAAEDEQIAR 
KLLASEKERA EHAMLVDLER NDLGRVCAYG TVRVDEWMTV EKYSHVMHIV SHVSGTMTTE 
HDAFSVIRAM FPGGTITGAP KVRTMEIIEE LEPVRRGLYT GSIGWIDFQG NMELNIAIRT 
MVVKDGLAHV QAGAGIVIDS NPEHEYKECL KKAAALWKAK ELSEAEALFP STR