Gene Pnec_1110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnec_1110
Symbol
ID	6184018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. necessarius STIR1
Kingdom	Bacteria
Replicon accession	NC_010531
Strand	-
Start bp	969962
End bp	971203
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	47%
IMG OID	641671720
Product	BNR/Asp-box repeat protein
Protein accession	YP_001797897
Protein GI	171463784
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4692] Predicted neuraminidase (sialidase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGTA TTGTTGCCCT GTGTTTTTTA TTGCTCGCCG CAGTGATCGG GTTTCTGCAT 
ATTGATAGTT GTCCGAGTTG GGCACCTTTT GCTTTATCCT CTGCACTCCA AGCAGAGGAT 
CAGGGTGATG GGTTGGTAGA AATCAAGCCT AAAGCTTTGT CCAAGGCAAT TATTCCAGCA 
TCACAAACCA ATTGGCTCCC CGATACAGGT GCTGCGTCAG TTCATGCGGC CTCTATGATT 
GCTTTAAAAG ATGGCGCAGT TCGGGTGTTT TGGTTTGCAG GCAGTCGCGA GGGCGCTGCT 
GATGTGGCGA TCTATAACTC TGTATACGAC CCCCATTCAA CAAATTGGAG TGCACCTACC 
GTTGTAATGG ACCGCGTAAG CGCTGAGAAG GGTTTGTTGC GTTACATTGC CAAATTAGGC 
AATCCTGTAC CCACTAGATT GGTTGATGGA AGGTTGCAAT TATTTTTCGT AACGGTATCG 
ATTGGCGGAT GGGCGGGTAG CTCGATTTCT GCAATCACTT CGGATGATGA GGGTTTAACT 
TGGAGTAGTC CTCAGCGTTT GATCAGTTCG CCTTTATTGA ATCTGAGTAC TCTGGTGAAG 
TCACCTGGCG TTATGTTTGT TGATGGATTA ATGGGTATGC CCGCCTATCA TGAGTGGGTA 
GGGCGCTTTG GTGAATTCTT GAGGGTAGAT GCGGGCCGAG TCATTGATAA ACGACGTATG 
AGCTCAGGGC GCGGCGCAAT TCAGCCGTTA GTTTTTGTCA ATGATGCCCA AGACGCTAGT 
GCTTTTTTTC GGCAAACGCG CAGTGCAGGT TTGCCAAAAC AAATTCCAGT TAGCTACACC 
CAAAATGCAG GTCAAAACTG GCATCAGTCT GAAGATTTAG CAATTGCCAA CCCAAATTCT 
GCTGTAGCAG GCGTGATTCT TAAGAGTGGC ACCCGCATAT TGGTTTTAAA TGATATTGAG 
TATGGTCGTC ATCGCCTGGT TTTAATGATG AGCAGTCCTA AAAATGGACA ATGGCAAACC 
GTGGAGGTAT TAGAGGATGA TGAAGCTCTG CCTGATATCC AGCGTAAAGA ATTTTCCTAT 
CCGTACTTGA TTACCGTTGA TGGTGAGGAT GCGCATTTGG TATATACCTG GGATCGAAAA 
AAGATTCGTC ATCGCTATTT TTCAAGCGCT TGGTTAAAGC ACGCATTTAG TAAGGTACAG 
ATACAAGCAG CGGATGTACC AAGTCAGGAG GCTCAGCAAT GA

Protein sequence

MSRIVALCFL LLAAVIGFLH IDSCPSWAPF ALSSALQAED QGDGLVEIKP KALSKAIIPA 
SQTNWLPDTG AASVHAASMI ALKDGAVRVF WFAGSREGAA DVAIYNSVYD PHSTNWSAPT 
VVMDRVSAEK GLLRYIAKLG NPVPTRLVDG RLQLFFVTVS IGGWAGSSIS AITSDDEGLT 
WSSPQRLISS PLLNLSTLVK SPGVMFVDGL MGMPAYHEWV GRFGEFLRVD AGRVIDKRRM 
SSGRGAIQPL VFVNDAQDAS AFFRQTRSAG LPKQIPVSYT QNAGQNWHQS EDLAIANPNS 
AVAGVILKSG TRILVLNDIE YGRHRLVLMM SSPKNGQWQT VEVLEDDEAL PDIQRKEFSY 
PYLITVDGED AHLVYTWDRK KIRHRYFSSA WLKHAFSKVQ IQAADVPSQE AQQ