Gene Mlg_2436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2436
Symbol
ID	4268742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2768536
End bp	2769549
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	69%
IMG OID	638127194
Product	biotin synthase
Protein accession	YP_743266
Protein GI	114321583
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.113139
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGCCA CCAAATCAAT GACCGCCACA ACCCAAACAC CCCGCCACGA CTGGTCTAAA 
GACGAAGTCC TGGCCCTGTT CGAGCAGCCC TTCAACGACC TGCTCCACCA AGCCCAGACC 
ACCCACCGGG CCCACTTCGA CCCCAACACC GTCCAGGTCA GCACCCTGCT CAGCATCAAG 
ACCGGCGCCT GCCCGGAGGA CTGCAAATAC TGCCCCCAGA GCGTGCGCTA CGACACCGGC 
CTGGAACGCG AGCAAATCCT GGCCGTGGAA GAGGTGGTGG CGGCCGCCCG CCGGGCCCGG 
GACGCCGGTG CTACCCGCTT CTGTATGGGC GCCGCCTGGC GCTCGCCCAA AGACCGCGAC 
CTGGAGACCG TCGAGGCCAT GGTGCGCGAG GTCAAGGCCC TGGGCCTCGA GACCTGCCTC 
ACCCTCGGCA TGCTCCGCGA CGGCCAGGCC GAACGCCTGC GCGAGGCCGG GCTCGACTAC 
TACAACCACA ACCTCGACAC CTCCGAGGAC TACTACGACG AAATCATCAC CACCCGCAGC 
TACCAGGACC GCCTCGACAC CCTCGCCCGG GTGCGCGACG CCGGCCTCAA GACCTGCTGC 
GGCGGCATCA TCGGCATGGG CGAAACCCGC CAGGACCGCG CCGAACTGCT GCGTACCCTG 
GCCAGCCTGC CGGTGCAGCC GCAGAGCGTC CCCATCAACC AGCTCGTCCA GGTCCCCGGC 
ACCCCGCTGC ACGGCGTCGA GCCCCCCGAC CCCTTCGAAT TCGTCCGCAC CATCGCCGTC 
GCCCGCATCC TCATGCCGGC CAGCTACGTC CGCCTCTCCG CCGGCCGCGA GCAGATGTCC 
GACGAACTGC AGGCCCTCTG CTTCCTGGCC GGCGCCAACA GCATCTTCTA CGGCGACAAG 
CTGCTCACCA CCGGCAACCC GGAGGCCGAC AAGGACCGCC GCCTGCTGGC CCGTCTGGGC 
ATGGGGTTTG AGGCGCACGC CTGCGCCCAG GCCGAGGCCG AGGACCTGGG ATGA

Protein sequence

MGATKSMTAT TQTPRHDWSK DEVLALFEQP FNDLLHQAQT THRAHFDPNT VQVSTLLSIK 
TGACPEDCKY CPQSVRYDTG LEREQILAVE EVVAAARRAR DAGATRFCMG AAWRSPKDRD 
LETVEAMVRE VKALGLETCL TLGMLRDGQA ERLREAGLDY YNHNLDTSED YYDEIITTRS 
YQDRLDTLAR VRDAGLKTCC GGIIGMGETR QDRAELLRTL ASLPVQPQSV PINQLVQVPG 
TPLHGVEPPD PFEFVRTIAV ARILMPASYV RLSAGREQMS DELQALCFLA GANSIFYGDK 
LLTTGNPEAD KDRRLLARLG MGFEAHACAQ AEAEDLG