Gene Mlg_0440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0440
Symbol
ID	4270384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	495081
End bp	496091
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	73%
IMG OID	638125175
Product	biotin--acetyl-CoA-carboxylase ligase
Protein accession	YP_741284
Protein GI	114319601
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0340] Biotin-(acetyl-CoA carboxylase) ligase
TIGRFAM ID	[TIGR00121] birA, biotin-[acetyl-CoA-carboxylase] ligase region [TIGR00122] BirA biotin operon repressor domain

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.028543
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.823385
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGA GCGAGGGCAG GCTCGCCGCG AGGGGCTCCG CGCAGGCGGT CCTGGAACGG 
CTGTCGGCCG GCGACTGCTG GTCCGGTGAG GCGCTGGGCC GCGAGCTGGG CATCTCCCGG 
GCAGCGGTCT GGAAGGCGGT GGCGACACTC CGGGGCCTCG GAGTGCCTGT CGAGGCGGTC 
GCTGGGAAGG GCTACCGGTT GCCCGGGCCG GTCGAGGTGC TGGATCGGCA GCGGATTGTC 
GCCGAGCTGC GGCGCGCGGG TGTGGCGCCG CTGCCCTCGG TGGACGTCTG GCTGTCGACC 
CCGTCCACCA ACCTGTGTGT GCTGGGGTCC CAGGCAGGCA CGCCGCGCGC CGCATTTGCC 
GAGGTCCAGA CCGCCGGCCG GGGCCGCCAG GGGCGGCGCT GGTGGTCGGC CTTTGGCGAG 
CAGGTTCAGT TCTCGCTGGC CTGGCATTAC CAGGCCCTGC CCGCACCGGT GCCCGGGCTG 
AGCCTCGCGG TCGGTGTCGA ATTGGCCGAG ACGCTGAGTG GGCTCGGCGC CCGGGGCCTG 
CAGTTGAAGT GGCCCAACGA CCTGCTGTGT AAGGAGGGGC GGAAGCTCGC CGGGATCCTG 
ATTGAGCTCG AGGGCCAGGT GCTGGGCCCG TGCCGGGTGG TGGTGGGGGT CGGGGTCAAC 
CACGGTCGCG GTGCCGGCGG CGCTGAGGCG GACCGGCCGG TGGCCAGCCT GGCCGAGGCG 
GGCCTGGAGG GCGTCGCGCG CAATCGATTG GCCGCGCTCC TGCTCAGCGC GGTGATCCGG 
GGCTGCCAGC GGTTCGGGGT CACCGGGCTC GACGACTACC GTGAGGGCTG GGCACGCTGG 
GATGCCCTGC GCGACCGGCC GCTGTCCGTG GTCCAGGCGG GGGCGACCTT ACGGGGCTGG 
GGCGCGGGGA TCAGCGAGGA CGGGGCCTTG GTCCTGACGC TGGCCTCGGG CGGGCAGCGT 
GTCTTGCATG CGGGGGAGGT GCATATCGGT GCCGCACTGG CTGATTCTTG A

Protein sequence

MSGSEGRLAA RGSAQAVLER LSAGDCWSGE ALGRELGISR AAVWKAVATL RGLGVPVEAV 
AGKGYRLPGP VEVLDRQRIV AELRRAGVAP LPSVDVWLST PSTNLCVLGS QAGTPRAAFA 
EVQTAGRGRQ GRRWWSAFGE QVQFSLAWHY QALPAPVPGL SLAVGVELAE TLSGLGARGL 
QLKWPNDLLC KEGRKLAGIL IELEGQVLGP CRVVVGVGVN HGRGAGGAEA DRPVASLAEA 
GLEGVARNRL AALLLSAVIR GCQRFGVTGL DDYREGWARW DALRDRPLSV VQAGATLRGW 
GAGISEDGAL VLTLASGGQR VLHAGEVHIG AALADS