Gene GYMC61_3305 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_3305
Symbol
ID	8527193
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	3366659
End bp	3368200
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	58%
IMG OID
Product	two component transcriptional regulator, AraC family
Protein accession	YP_003254340
Protein GI	261420658
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAGTGG CGATCGTCGA TGATGAAGCG TTGGAGCGAA GAGCGCTTTG CAAAATGATC 
CATGACCACC TTCCGGACAT CGAGGTGGTC GCCGAGGGCG CCAACGGGCG CGAGGCGATT 
GACATTGCCA AGCAATATCG CCCGGATGTG ATGCTTATAG ACATCAAAAT GCCCGGCCTT 
GACGGGCTGC AAGCGATCGA AGCGATTCGC CAAGACGGCC TCGATCTGGA ATTCATTATT 
GTGTCGGCGT TTGATTTGTT CGACTATGCG AAACAAGCGA TGCGGTTTGG CGTCAAGGAA 
TATTTATTGA AACCGAGCCG GAAGGAGGAG GTCATTTCGG CTTTGGAACG GGTCAGCCAA 
GAAGTGGCGG CCAAGCGGCG ACACGAGGAG AGCAGCCGCC AGCTCGAGGA GCAGATTCGC 
CGGTTGCAGA CGCTTGTGGA AAGCGAATGG CTGTCTGTCC TCATGACAGA AGACGTATCG 
GCTGATGAGT GGGAGCGGTG GAAGGAACTG CTGCCGTTTT CGATTGCGTC GGGGATGTTC 
CTCGTCATTC AGTTCCCGGA TGCAGGGGTG GCTGACGAAT GGAAATCATG GCTGGACAAG 
CAGCTTAGCG GGAAGGCGCC AACGCGCTAT TGGATCGGGC GGATGGCGAA CCGGCGCCTG 
CCGGTCTTGT TTTTCCGCAG CCCAAACGAT GGCGAGCCGG CCTGGAAGCC CACCGTCCAG 
GCATTGGCGC TCGATTTGGC GCGGCAGTTT TCGGCCCGGT ACGGCGCCGC GCTGTATATC 
GGGCTCGGCT CCCCGTTTTC CCGCCTTGAC CAACTTCGTT CCTCGTACTA TGAGGCGCTG 
TCGGCCGCTC ATTATTACGC CGACCGGCAA AAAGCACAAG TGGGGTTTCT GCCGGCGGAA 
GCGACGCGCG CCGGCGGGGA AGCGGAACGG GATAAACAGC TGTTTGAAGC GCTGCGCCTT 
GGCGACATCG AGCAAGCCCG GATGATTGGT CTGACGTATA TAGAGGAACT GGCCTCTTCT 
CATTCACTGC CGGCCGCCGG TCGCAAAGCG GAAGAGACCT TTGTGTGGCT CGGGCGTCTT 
CTATCGGAGC TGGGCATTCG TTATGAGCGG CTCGCTTCCT TTGCTTCCTG CCGGTCGGCG 
GCAGAATTGA AGCGGGCGGC GCTTGATGAA CTGGACCGCA TCGCCGCTGA TCTCGAGGTT 
TGGCGCCAGC AGCAAGCGTA TGGCAAACTC GGCAAGGCGA AAGACTACAT TGACCGCCAC 
TACGCCGAGC CGCTGACGCT TGAGGAGGTG GCGGAACAAG CGGGCATCAG TCCGTACTAC 
TTCAGCAAAC TGTTCAAAGA GCATTTTGGC ATCACCTTTA TCGACTACGT GACGAACGTG 
CGCATCGAAC GGGCGAAAGA AGCGCTGGCT GAGACGGATC AAAGCTTAAA AGAAATTTGT 
TTTTCAGTCG GCTACAACGA TCCCAACTAT TTCAGCCGCG TCTTTAAAAA GCAGACCGGC 
CTGTCGCCGA GCGAATACCG GAAAAAAGTA CAGGCGCGCT GA

Protein sequence

MKVAIVDDEA LERRALCKMI HDHLPDIEVV AEGANGREAI DIAKQYRPDV MLIDIKMPGL 
DGLQAIEAIR QDGLDLEFII VSAFDLFDYA KQAMRFGVKE YLLKPSRKEE VISALERVSQ 
EVAAKRRHEE SSRQLEEQIR RLQTLVESEW LSVLMTEDVS ADEWERWKEL LPFSIASGMF 
LVIQFPDAGV ADEWKSWLDK QLSGKAPTRY WIGRMANRRL PVLFFRSPND GEPAWKPTVQ 
ALALDLARQF SARYGAALYI GLGSPFSRLD QLRSSYYEAL SAAHYYADRQ KAQVGFLPAE 
ATRAGGEAER DKQLFEALRL GDIEQARMIG LTYIEELASS HSLPAAGRKA EETFVWLGRL 
LSELGIRYER LASFASCRSA AELKRAALDE LDRIAADLEV WRQQQAYGKL GKAKDYIDRH 
YAEPLTLEEV AEQAGISPYY FSKLFKEHFG ITFIDYVTNV RIERAKEALA ETDQSLKEIC 
FSVGYNDPNY FSRVFKKQTG LSPSEYRKKV QAR