Gene Pnec_0422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnec_0422
Symbol
ID	6183727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. necessarius STIR1
Kingdom	Bacteria
Replicon accession	NC_010531
Strand	-
Start bp	375129
End bp	376199
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	46%
IMG OID	641671113
Product	hypothetical protein
Protein accession	YP_001797312
Protein GI	171463199
COG category	[S] Function unknown
COG ID	[COG4394] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTTGGG ATATTTTCTG TCAAATCGCA GATAACTATG GTGATGCTGG TGTTTGCTGG 
CGTCTAGCCC GAAACTTATC AAGCATTCAT GGACAAGAAG TGCGTATTTT TTGCGATGAT 
CTGCCAACCC TCAATTTACT CGCTTCGGGT GTAGATCCAG CGATTAAGCA AAAAATAGAC 
CTTCAGCCGT GGGAAGCAAG TTATGTCAAT GCAAGACACC CAGTACAAAC ACCCGACGTG 
GTCATAGAAG CATTCGGATG CGAACTACCA GAGCGCTATC TTGCAGGCCT GTTTATAGCC 
TCCATCAAAC CCATCATCAT TAATCTGGAA TATCTCAGCG CAGAATCCTG GATTACTAAG 
TTCCACGGCA AAGCATCACC CCAGTCTCAT GGAATTCCGA AATATTTTTT CTTTCCAGGG 
TTTCAAGATG AGGTAGGCGG CCTATTGCTT GACCCCATCC CCGCTGAGGG GCGCCTCACT 
CATGAAGATA TTCCCAAAGA TCTTCAAGTA GCTTGGTCGA AGTTGCGACC TGGAGCAAAA 
CGAACTAGTG TATTTTGCTA CCCAGGCGCA CCACTGAAAA AATGGCTAGA GGACCTAGGT 
CGCCTTGATA TACAAGTAGA TGTTTTGCTT GCCCATGGTC ATGCGGAACA GCTTAATCTT 
TATGGAGAGC AGCCAATCTC ATTGCCAACC AATTTACAGC TGATTTCAAT GCCTTTTGTT 
TCTCAAGATG AATATGATTG GGTACTAACG CAATGTGACT TCAATATTGT GCGCGGGGAG 
GATTCTTTTA TTCGAGCCCA GTTAGCAGGA AAACCATTTA TTTGGCATAT TTATCCGCAA 
GAAGATCGCG CCCATGAAGT GAAATTAGCC GCCTTTCTGG ATCTTTATCT TGATGAGGCC 
GATCAAGAGT TAAGGCTTGC CGCAATCTCA GCAATGACCT GGGCAATGCC TAGCGAATGG 
TTTGGCAACC TAAGCGTCTG GAACAATCAC GCCGAGCACT GGCGTAGCCA TTTACTCAAA 
AAACAAGGGG ATGGCGGCCT GCCAGCGCGT TTAACTCGCT TTGTCGCATA A

Protein sequence

MRWDIFCQIA DNYGDAGVCW RLARNLSSIH GQEVRIFCDD LPTLNLLASG VDPAIKQKID 
LQPWEASYVN ARHPVQTPDV VIEAFGCELP ERYLAGLFIA SIKPIIINLE YLSAESWITK 
FHGKASPQSH GIPKYFFFPG FQDEVGGLLL DPIPAEGRLT HEDIPKDLQV AWSKLRPGAK 
RTSVFCYPGA PLKKWLEDLG RLDIQVDVLL AHGHAEQLNL YGEQPISLPT NLQLISMPFV 
SQDEYDWVLT QCDFNIVRGE DSFIRAQLAG KPFIWHIYPQ EDRAHEVKLA AFLDLYLDEA 
DQELRLAAIS AMTWAMPSEW FGNLSVWNNH AEHWRSHLLK KQGDGGLPAR LTRFVA