Gene Pnec_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnec_1054
Symbol
ID	6182952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. necessarius STIR1
Kingdom	Bacteria
Replicon accession	NC_010531
Strand	-
Start bp	917359
End bp	918429
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	48%
IMG OID	641671666
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_001797843
Protein GI	171463730
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	0.347892
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTG CAGTCCTGCC GGGCGATGGT ATCGGCCCGG AAATCGTTGC TCAAGCCGTT 
CGAGTGCTCC AAGCGCTTGG CCCAGAGTTT GATTTAGAAG AAGCTCCAGT TGGTGGCGCT 
GCCTATGATG CGGCAGGCCA TCCTTCGCCG CCGGCTACTT TAGAGTTGGC TAAAAAAGCA 
GATGCCATTT TGTTTGGTGC AGTTGGCGAC TGGAAATACG ATACGCTTGC ACGCGAGCTG 
CGTCCAGAGC AAGCAATTCT AGGTTTGCGT AAACACCTTG AATTGTTTGC CAACTTCAGA 
CCAGCGATTT GCCATCCAGA ACTCACGGCC GCATCGAGCC TCAAGCCAGA AATTATCGGC 
GGCTTAGATA TTCTGATTGT GCGCGAGCTC AATGGCGATA TTTACTTTGG TCAACCGCGC 
GGTATTCGTA CTTCAGAGTT GCCCTTATTT AAAGGTGCTC GCGAAGGTTT TGACACCATG 
CACTATAGCG AGCCAGAAGT AGAGCGTATT GGTCGGGTTG CTTTCGAAGC AGCGCGTAAG 
CGCAGTAAAA AAGTATGTAG CGTTGATAAG GCCAACGTAC TAGAGACTTC ACAGCTTTGG 
CGTGAGGTGA TGATTCGTAT TGCCAAAGAA TATCCGGATG TTGAGTTATC TCATATGTAT 
GTGGATAACG CTGCAATGCA ATTGGTCAAA GCACCTAAAG CATTTGATGT TGTAGTAACC 
GGAAATTTAT TCGGTGACAT TCTGTCCGAC GAAGCGGCGA TGTTGACTGG CTCCATTGGT 
ATGTTGCCAT CTGCCTCTTT GGATAAAAAT AATAAAGGCT TGTATGAGCC AAGTCACGGC 
TCCGCGCCTG ATATTGCTGG TAAAGGTATT GCTAATCCAT TGGCAACGAT TTTGTCTGCT 
GCGATGATGT TGCGTTACTC CTTGGGTATG CCTGCTGAAG CAGATCGCAT TGAAAAGGCC 
GTGCAAAAAG TATTGGCGCA AGGATTGCGA ACTGCCGATA TTTATACCGA AGGTACGAAA 
AAGGTGTCTA CGGTTGAAAT GGGCGATGCT GTAGTTGCGG CGCTGGCTTA A

Protein sequence

MKIAVLPGDG IGPEIVAQAV RVLQALGPEF DLEEAPVGGA AYDAAGHPSP PATLELAKKA 
DAILFGAVGD WKYDTLAREL RPEQAILGLR KHLELFANFR PAICHPELTA ASSLKPEIIG 
GLDILIVREL NGDIYFGQPR GIRTSELPLF KGAREGFDTM HYSEPEVERI GRVAFEAARK 
RSKKVCSVDK ANVLETSQLW REVMIRIAKE YPDVELSHMY VDNAAMQLVK APKAFDVVVT 
GNLFGDILSD EAAMLTGSIG MLPSASLDKN NKGLYEPSHG SAPDIAGKGI ANPLATILSA 
AMMLRYSLGM PAEADRIEKA VQKVLAQGLR TADIYTEGTK KVSTVEMGDA VVAALA