Gene Mlg_1236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1236
Symbol
ID	4269020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1440656
End bp	1441891
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	68%
IMG OID	638125986
Product	tryptophan synthase subunit beta
Protein accession	YP_742075
Protein GI	114320392
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.617865
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.527603
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACCA AGGTGACTGA CGTGATTGAA CGCATCCCCG GCTTCGACCG CTACCCGGAC 
GAGGCGGGGC ATTTTGGGCC CTACGGCGGG CGCTTCGTTT CCGAGACCCT GATGGCTCCG 
CTGGACGAGC TGGCGCAGGC CTACGATCAC TACCGCAATG ACCCGGAGTT TCTGGCCGAG 
ATCGACCGGG ATTTGCAGGA CTTTGTCGGT CGGCCCAGCC CGCTGTACCT GGCGGAGCGC 
TGGACCCAGC GGATCGGTGG TGCGCGGATC TACTTCAAGC GTGAAGACCT CAACCACACC 
GGCGCCCACA AGATCAACAA CACCGTGGGC CAGGCGCTGC TGGCTAAGCG GATGGGCAAG 
ACCCGGGTCA TCGCTGAGAC CGGTGCCGGG CAGCACGGCG TGGCCAGCGC CACGGTGGCG 
GCGCGCCTGG GCATGCAGTG CGTGGTGTAT ATGGGCGCGG ACGACGTCAA GCGTCAGGCG 
GTCAATGTTT TCCGCATGCG CCTGCTCGGC GCCGAGGTGC GGCCGGTGGA CGCCGGCACC 
CGGACGCTCA AGGACGCCCT CAACGAGGCA ATGCGCGACT GGGTGGCCCA TGTGGACGAC 
ACCTTCTACA TCATCGGCAC CGTCGCCGGC CCCCACCCCT ACCCGATGAT GGTGCGCGAC 
TTTCAGACCG TGATCGGGCG GGAGGCGCGG CGCCAGATGC TCGAGCGCGA GGGCCGGCTG 
CCCGATGCCC TGGTGGCCTG TGTGGGGGGC GGCTCCAACG CCATTGGCCT GTTCCACCCC 
TTCCTGGCGG ACCAGGCCGT GGCCATCTAC GGGGTCGAGG CCGGCGGCGA AGGGGTGGAG 
AGCGGGCGGC ATGCCGCGCC CCTGTGCGCC GGCCGCTCCG GGGTGCTGCA CGGCAACCGC 
ACCTACCTGA TGATGAACGA CTCCGGCCAG ATCCAGGGGA CCCACTCGAT CTCTGCCGGG 
CTCGACTACC CGGGGGTCGG GCCGGAGCAT GCCTGGCTGA AGGACTCCGG CCGTGCCCAA 
TACGTCAGCG TGACCGATGA CGAGGCCCTG GAGGCGTTCC ACGAGGTGAC CCGCTGCGAG 
GGCATCATGC CAGCCCTGGA GACCGCCCAT GCCCTGGCCT ATGCCCGCAA GCTGGCCGCC 
GGGATGAGCC CGGAGCAGAG CGTGGTGGTG AGCCTGTCCG GGCGGGGTGA CAAGGATATT 
GCGACGGTGG CCGAGCTGGA GGGCATTGAG CTATGA

Protein sequence

MSTKVTDVIE RIPGFDRYPD EAGHFGPYGG RFVSETLMAP LDELAQAYDH YRNDPEFLAE 
IDRDLQDFVG RPSPLYLAER WTQRIGGARI YFKREDLNHT GAHKINNTVG QALLAKRMGK 
TRVIAETGAG QHGVASATVA ARLGMQCVVY MGADDVKRQA VNVFRMRLLG AEVRPVDAGT 
RTLKDALNEA MRDWVAHVDD TFYIIGTVAG PHPYPMMVRD FQTVIGREAR RQMLEREGRL 
PDALVACVGG GSNAIGLFHP FLADQAVAIY GVEAGGEGVE SGRHAAPLCA GRSGVLHGNR 
TYLMMNDSGQ IQGTHSISAG LDYPGVGPEH AWLKDSGRAQ YVSVTDDEAL EAFHEVTRCE 
GIMPALETAH ALAYARKLAA GMSPEQSVVV SLSGRGDKDI ATVAELEGIE L