Gene Acid345_2542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2542
Symbol
ID	4072186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3003111
End bp	3004322
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	61%
IMG OID	637984559
Product	phosphoglycerate kinase
Protein accession	YP_591617
Protein GI	94969569
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0126] 3-phosphoglycerate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAAGC TCTCAATTAA AGATCTACAG CTATCCAATA AACGCGTATT CATGCGCGTG 
GATTTCAACG TCCCTCTCGA TGAAAACGGC CGCGTCACCG ACGACACCCG CATCCGCGAA 
ACGCTGCCCA CCATCGAATA CGCCCTGCGC CACGGCGCGA AGCTGATCCT CTGCTCGCAC 
CTCGGACGCC CGAAGGGCAA ACCCAATCCA AAAATGAGCC TCAAGCCCGT TGCCGAGCGC 
CTACGCGTGA TGCTCGACCA CGCGATCAGT CCCGGCCAGA ATGTCGGCTT CTCGCCCGAT 
TGCATCGGTA TGCAAGCGCA GGAGATGGCG AAGCAGTTGG AAAAGGGCCA GGCCCTTCTG 
CTGGAGAATG TTCGCTTCCA CGCCGAAGAG GAGAAGAACG ATCCGGCCTT CGCGAAGGAA 
CTCGCCAGCC TCTGCGAGCT CTACGTGAAC GATGCGTTCG GCTCCGCACA CCGCGCCCAC 
GCCTCGACGG AAGGCATTAC GCACTACGTC GAGAAATCGG CTGCGGGCTT GCTGATGCAG 
AAGGAACTCG ACTATCTCGG CAAGGCGACC TCGAACCCGG CGAAGCCGTT CGTGGCCATC 
CTCGGCGGCG CCAAGGTCAG CGACAAGATC GGCGTCATCC AGAACCTCAT GGCCAAAGTT 
GACGCCATCA TCATCGGCGG CGGCATGGCT TACACCTTCC TCAAGGCGCA GGGCCAGGAG 
ATCGGTAAGT CCCTCTTCGA GGCCGATAAA CTCGACCTCG CCAAGCAGAT CCTGGCCGAC 
GCGCACAAAC GCGGATTGAA GTTCCTGCTG CCCGTCGACC ACGTCACTGC CGACAAGTTC 
GACATGCACG CCACCCCCCA TCAGATCGGT GAAGGCCAGT CCATACCAGC CGAGCAGATG 
GCGCTGGATA TCGGCCCTAA GACGGTCGCT CTCTTCTCAG AGGAGATCGC GAAGGCGCGC 
ACGATCGTGT GGAACGGTCC CATGGGCGTC TTCGAGTTCG ACAACTTCGC CAAGGGCACC 
CGTGCCATCG CCAAAGCCGT TGCCGGCAAC AGCGGCGCCA CCTCAATCGT AGGCGGAGGC 
GACAGTGTAG CGGCGGTGCA CGATGCCGGC GTTGCCGACA AGATCACCCA CATCTCCACT 
GGCGGCGGCG CTTCGCTGGA GTTCCTGGAA GGCAAGAAAC TGCCCGGCGT GGAAGCGCTG 
ACCAACAAAT AG

Protein sequence

MSKLSIKDLQ LSNKRVFMRV DFNVPLDENG RVTDDTRIRE TLPTIEYALR HGAKLILCSH 
LGRPKGKPNP KMSLKPVAER LRVMLDHAIS PGQNVGFSPD CIGMQAQEMA KQLEKGQALL 
LENVRFHAEE EKNDPAFAKE LASLCELYVN DAFGSAHRAH ASTEGITHYV EKSAAGLLMQ 
KELDYLGKAT SNPAKPFVAI LGGAKVSDKI GVIQNLMAKV DAIIIGGGMA YTFLKAQGQE 
IGKSLFEADK LDLAKQILAD AHKRGLKFLL PVDHVTADKF DMHATPHQIG EGQSIPAEQM 
ALDIGPKTVA LFSEEIAKAR TIVWNGPMGV FEFDNFAKGT RAIAKAVAGN SGATSIVGGG 
DSVAAVHDAG VADKITHIST GGGASLEFLE GKKLPGVEAL TNK