Gene Mlg_1870 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1870
Symbol
ID	4268088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2131537
End bp	2133621
Gene Length	2085 bp
Protein Length	694 aa
Translation table	11
GC content	65%
IMG OID	638126626
Product	polyphosphate kinase
Protein accession	YP_742704
Protein GI	114321021
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0855] Polyphosphate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAAA AAACGATCGA TCTCAAGCAA CCGGACCTCT ACTTCAACCG CCTGCTCAGC 
CTGCTGGAGT TCAACCGCCG GGTGCTCGCC CAGGCCAAGG ACACCGACAC CCCGCTGCTG 
GAACGCCTCA AGTTCCTCTG TATCTGCACC TCGAACATGG ACGAGTTCTT CGAGGTGAGG 
GTCTCGGGGG TGAAACACAA GGCCGAGGCC GGTTCGGTTC AGGCCGAGTC GGACAATCGC 
AGCCCGCAGG AGACCCTGAA TGCCATCAGT GCCGTCAGCC ACGAGCTGGT AGCCGAGCAG 
TACCGCGTCC TCAACGAGGA ATTGATCCCG GCCCTGGCGG AAGAGGACAT CCGCTTCATC 
CGCCGGGCCG ATTGGACCGA CGCCCAGACG GAGTGGCTGC GCCGTTTTTT CGAGGACGAG 
CTGCTGCCGG TGCTCAGCCC CCTGGGACTG GATCCGGCCC ACCCCTTCCC CAAGGTACTG 
AACAAGAGCC TGAACTTCAT CGTCAGCCTG GAGGGCAAAG ATGCCTTCGG CCGCAACAGC 
GGGTTCGCCA TCGTGCAGGC GCCGCGCGCC CTGCCGCGCC TGATTCAACT GCCCCGGGAG 
GGTGAGGACA ACGGACCCTG GGACTTCGTC TTCCTGTCCT CGGTCATTCA CGCCTTCGTG 
GATCAGCTCT TCCCGGGCAT GAAGATCAAG GGCTGTTATC AATTCCGGGT GACCCGCAAC 
AGCGATCTGT TTGTTGACGA GGAGGAGGTG GACGACCTGC TGCGGGCGCT GGAGGGGGAG 
CTGCTCTCCC GCCGGTACGG CGAGGCCATT CGCTTGGAGG TGGCGGCCAA CTGTTCCGAG 
GACCTGGCCA ACTTCCTGCT GCGCAAGTTC GAGCTCGGGC CGGACGACCT CTACCAGGTG 
GACGGGCCGG TCAACCTGAA CCGGATGATG GCGGTCTACG ACCTGGTGGA CCGCCCCGAT 
CTGAAGTATC CGTCGTTCAC CCCCGGGCTG CCGGCGGATT TCAGCCACAG CGGCGATATC 
TTCAAGGTCC TGCGCAAGCG CCAGGTGCTG CTGCACCACC CCTTCCAGTC CTTTGCCCCG 
GTCATCGAGC TGGTGCGCCA GGCCTCGCTG GATCCGGACG TGCTCGCCAT CAAGCAGACC 
CTCTACCGCA CCGGGCCCGA TTCCGCCATC GTCGATCACC TGGTGCGCGC GGCGCGGGAC 
GGTAAGGAGG TCACCGTTAT CATCGAGTTG CGCGCCCGCT TTGACGAGGC GGCCAACATC 
GCCCTCGCCA ACCGGCTGCA GGAGGCCGGC GTGCACGTGG TCTATGGGGT CGTGGGCCAC 
AAGACCCATG CCAAGATGCT GCTGGTGGTG CGCCGCGAGG GGCGCAAGCT GCGCCACTAC 
GTGCACCTGG GGACCGGCAA CTACCACTCA CGCACCGCGC GGCTCTACAC CGACTATGGC 
CTGTTCACCC GAGACAAGCA TACGGGTGAG GATGTCCACC GGCTGTTCCT GCAAATGACC 
AGCCTGGGGC GTTTCTCCGA GCTGAAACGC CTGCTGCAAT CGCCCTTCAC CTTGCGGGAG 
GGGGTGATCC AGCGCATCCA ACGGGAGGCC GAACACGCCC TCGCCGGTCA CGAGGCCCGC 
ATTATCGTCA AGGTCAATTC CCTCACCGAG CCTGGTGTCA TCCAGGCGCT CTACCAGGCC 
TCGCAGGCAG GCGTCACCGT CGACCTGATC GTGCGCGGCA TGTGCTGTCT GCGCCCCGGG 
GTACCGGGGG TCTCGGACAA CATTCAAGTC CGCTCCATCA TCGGCCGCTT CCTGGAACAT 
ACCCGGGTGT TCTATTTCCA CAACCGGGGC GACAGCGACC TCTATGCCAG CAGCGCCGAT 
TGGATGGAGC GCAATTTCTT CCGGCGGGTG GAGACGGCCT TCCCCCTCCT GGACGAGGAG 
GCGCGCCGGC GGGTGCTGCT GGACCTGGAG TGCTATCTCA AGGACAACAC CCAGGCCTGG 
CTGCTGCAAC CCGACGGCAG TTACGTGCGC CTCCAGCCCG CGGAGGGCGA GGAACCCTAC 
TGCGCCCAGC GGGCCCTCCT CGCGTTGCTC GCCGACAGTG CCTGA

Protein sequence

MDQKTIDLKQ PDLYFNRLLS LLEFNRRVLA QAKDTDTPLL ERLKFLCICT SNMDEFFEVR 
VSGVKHKAEA GSVQAESDNR SPQETLNAIS AVSHELVAEQ YRVLNEELIP ALAEEDIRFI 
RRADWTDAQT EWLRRFFEDE LLPVLSPLGL DPAHPFPKVL NKSLNFIVSL EGKDAFGRNS 
GFAIVQAPRA LPRLIQLPRE GEDNGPWDFV FLSSVIHAFV DQLFPGMKIK GCYQFRVTRN 
SDLFVDEEEV DDLLRALEGE LLSRRYGEAI RLEVAANCSE DLANFLLRKF ELGPDDLYQV 
DGPVNLNRMM AVYDLVDRPD LKYPSFTPGL PADFSHSGDI FKVLRKRQVL LHHPFQSFAP 
VIELVRQASL DPDVLAIKQT LYRTGPDSAI VDHLVRAARD GKEVTVIIEL RARFDEAANI 
ALANRLQEAG VHVVYGVVGH KTHAKMLLVV RREGRKLRHY VHLGTGNYHS RTARLYTDYG 
LFTRDKHTGE DVHRLFLQMT SLGRFSELKR LLQSPFTLRE GVIQRIQREA EHALAGHEAR 
IIVKVNSLTE PGVIQALYQA SQAGVTVDLI VRGMCCLRPG VPGVSDNIQV RSIIGRFLEH 
TRVFYFHNRG DSDLYASSAD WMERNFFRRV ETAFPLLDEE ARRRVLLDLE CYLKDNTQAW 
LLQPDGSYVR LQPAEGEEPY CAQRALLALL ADSA