Gene Mlg_2752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2752
Symbol
ID	4270221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	3123387
End bp	3124685
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	63%
IMG OID	638127514
Product	citrate synthase
Protein accession	YP_743582
Protein GI	114321899
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01798] citrate synthase I (hexameric type)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.816634
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGA AGACCGTCAC CCTGACCGAC AACAGCACCG GCAAATCCGT GGAGTTGCCG 
GTCTATCAAG GCACCCACGG CCCCGAGGTC ATCGACATCA AGAATGTCTA TGGCGAGCTG 
GGCTACTTCA CTTACGACGC TGGCTTCACC TCCACCGCCA GCTGCAAAAG CGATGTCACC 
TTCATCGATG GTGACAACGG CGTGCTGCTG TATCGCGGCT ACCCCATCGA ACACCTGGCT 
GAGAAGAGCT CCTTCCTGGA GGTCTCCTAC CTACTGCTGC ACGGCGAATT GCCGAACAAG 
GCCGAACTGG ACCAGTTCGT CAGCTCGGTG ACCAACCACA CCATGCTCAA CGAAAGCCTG 
AAGGACTTCT TCGACGGCTT TCATTACAAC GCCCACCCCA TGGCCATGCT CACCGGGGTG 
GTCGGGTCGC TATCCGCCTT CTACCACGGC GAACTGGACA TCAACGACCC GAAGAACCGG 
GAGCTGACCG CGCACCGGGT CATCGCCAAG ATGCCGACCA TCGCCGCGGC GGCCTACAAA 
CACCTGGTGG GCGAGCCCTT CGTCTACCCG CAGAACCACC TGTCCTACGC GGGGAACCTG 
CTGAACATGC TGTTCTCCCG CCCCACCGAG AAGTACGAGG TTAACCCCGT GGCCGAGCGG 
GCGCTGGACC AGCTCCTGAT CCTGCACGCT GACCACGAGC AGAACGCCTC CACCTCCACG 
GTGCGCCTGG CCGGTTCCAC CGGCACCAAC CCCTTCGCCG CCATCGCAGC TGGTTGCGCC 
GCGCTGTGGG GACCGGCGCA TGGGGGGGCC AACGAGGCGG TGCTGAACAT GCTCAACGAG 
ATCGGCGACG TCTCCAACGT GCCCAAGTTC ATCGAAAAGG CGAAGGACAA GAACGACCCC 
TTCCGCCTGA TGGGCTTCGG TCACCGGGTC TACAAGAACT TCGACCCGCG GGCCACCATC 
ATCCGCAAGA CCTGTCACGA GGTCCTGGAG GAACTCGGCG TGGGCAAGGA CCCGCAGCTG 
GAGCTGGCCA TGGAGCTGGA GGATATCGCC CTGCAGGACG AGTACTTCGT CGAGCGCAAG 
CTCTACCCGA ACGTCGACTT CTACTCGGGC ATCATCTACC GCGCGCTGGG CATCCCCACC 
GAGTTCTTCA CGGTGCTGTT TGCCCTGGGC CGCACCCCGG GCTGGCTGGC GCAGTGGATG 
GAGATGGTCA ACGACCCCGA GCAGCGCATC GGGCGTCCGC GCCAGCTCTA CACCGGCGCC 
GCCAAGCGCG ACTACGTGCC GGTGGATCAG CGCAGCTGA

Protein sequence

MSEKTVTLTD NSTGKSVELP VYQGTHGPEV IDIKNVYGEL GYFTYDAGFT STASCKSDVT 
FIDGDNGVLL YRGYPIEHLA EKSSFLEVSY LLLHGELPNK AELDQFVSSV TNHTMLNESL 
KDFFDGFHYN AHPMAMLTGV VGSLSAFYHG ELDINDPKNR ELTAHRVIAK MPTIAAAAYK 
HLVGEPFVYP QNHLSYAGNL LNMLFSRPTE KYEVNPVAER ALDQLLILHA DHEQNASTST 
VRLAGSTGTN PFAAIAAGCA ALWGPAHGGA NEAVLNMLNE IGDVSNVPKF IEKAKDKNDP 
FRLMGFGHRV YKNFDPRATI IRKTCHEVLE ELGVGKDPQL ELAMELEDIA LQDEYFVERK 
LYPNVDFYSG IIYRALGIPT EFFTVLFALG RTPGWLAQWM EMVNDPEQRI GRPRQLYTGA 
AKRDYVPVDQ RS