Gene Pnec_1624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnec_1624
Symbol	ipk
ID	6182966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. necessarius STIR1
Kingdom	Bacteria
Replicon accession	NC_010531
Strand	+
Start bp	1426668
End bp	1427558
Gene Length	891 bp
Protein Length	296 aa
Translation table	11
GC content	45%
IMG OID	641672141
Product	4-diphosphocytidyl-2-C-methyl-D-erythritol kinase
Protein accession	YP_001798312
Protein GI	171464199
COG category	[I] Lipid transport and metabolism
COG ID	[COG1947] 4-diphosphocytidyl-2C-methyl-D-erythritol 2-phosphate synthase
TIGRFAM ID	[TIGR00154] 4-diphosphocytidyl-2C-methyl-D-erythritol kinase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.431144
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAATC TCGATTCTTT ATCTCTTCGC TCACCAGCTA AGCTCAATCT TTTTTTGCAT 
ATCGTTGGTC GCAGGACTGA TGGTTATCAC CTGCTTCAAT CTGTCTTTCA ATTAATCGAT 
TGGTGCGACA CGCTGCACTT GAAACGTATT TCTGAAAATG TAGTGCGGCG AATCAACCCA 
ATTCCCGGAG TTGCACCAGA ACACGATCTA GTGGTTCGCG CAGCAAATTT ACTAAAAGAT 
TTTTGCCAAT TTGAAGGCGG CGTTGAAATT AACCTGCAAA AAGAAATTCC GATGGGCGCT 
GGTATGGGCG GAGGATCTTC AGACGCAGCG ACTACTTTGA TCGGACTTAA CGCCCTTTGG 
AGTCTCAACC TTTCCAAAGA AACGCTTTGC GCCTTAGGCC TAAAGCTGGG AGCCGATGTT 
CCATTCTTTA TTTTTGGCAA AAATGCCTTT GTTGAGGGTG TCGGGGAGAA AATGCGAGAA 
ATCTCCCTCG AAACCCCTGA TTTTTTGGTC ATATTTCCCA ACCGGGGAAT TGCAACCGCT 
AGCATTTTTC AAGACCCGGA ATTGACCCGA GATCACGCTC AGATTACAAT TGATGGCTTT 
CTTACATCGC CATTATTGTA TCAATCGAAT GATTGCCAAG CGGTAGCGAT GAGGATTTAC 
CCAGAAGTGA AGCAAGCTTT GGATTGGATT ACCCAGGCAG TACCGGGCTC ACAGCCCCGT 
ATGTCAGGCT CTGGAAGTAG TGTTTTTGCA GTCTTAGACT CTAAGACTGA CATCGCAAAA 
CTAAAAAATT TTCTTCAAAA TCTTCCTAAA GGGTGGGTAG GTCGGGTTGT TCGGGGGCTA 
AATAAAAACC CCGCTTACAA TTTGATTTCA TTTCTTCAGA TTGACCTGTA G

Protein sequence

MVNLDSLSLR SPAKLNLFLH IVGRRTDGYH LLQSVFQLID WCDTLHLKRI SENVVRRINP 
IPGVAPEHDL VVRAANLLKD FCQFEGGVEI NLQKEIPMGA GMGGGSSDAA TTLIGLNALW 
SLNLSKETLC ALGLKLGADV PFFIFGKNAF VEGVGEKMRE ISLETPDFLV IFPNRGIATA 
SIFQDPELTR DHAQITIDGF LTSPLLYQSN DCQAVAMRIY PEVKQALDWI TQAVPGSQPR 
MSGSGSSVFA VLDSKTDIAK LKNFLQNLPK GWVGRVVRGL NKNPAYNLIS FLQIDL