Gene Pnuc_1900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnuc_1900
Symbol
ID	5053864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. asymbioticus QLW-P1DMWA-1
Kingdom	Bacteria
Replicon accession	NC_009379
Strand	+
Start bp	1978285
End bp	1979805
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	46%
IMG OID	640472074
Product	threonine dehydratase, biosynthetic
Protein accession	YP_001156676
Protein GI	145590079
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01124] threonine ammonia-lyase, biosynthetic, long form

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACGA ACTATTTAAA GAAAATTTTA TCGGCTCGCG TCTATGACGT AGCTAGAGAA 
ACCGAGCTCC AAGTAGCTCC CGAACTTACC AGGCGATTGG GCAACCAGGT CTTACTGAAA 
AGGGAGGATA ACCAGCCGGT TTTTTCCTTC AAATTGCGTG GCGCCTATAA CAAAATGGCC 
CATTTACCCT TGGAAGCCCT AAAACGCGGG GTAATTGCTG CTTCTGCAGG CAATCATGCA 
CAAGGGGTAG CCCTTTCTGC CGCCAAAATG AAGTGCAAAG CAGTCATCGT GATGCCGGTT 
ACCACCCCTA GCGTCAAAAT TGATGCGGTA AAGGCCCGTG GCGGCTCTTG GGTCGAAATT 
ATTCTGCACG GCGAATCCTA TAGCGACGCT TTTAAGTATT CAGAAGTTCT GGGTAAAAAA 
CGCGGCCTCA CCTTCGTTCA CCCGTTTGAT GATCCTGACG TCATTGCCGG GCAAGGAACC 
ATTGCTCACG AAATTTTTAC GCAATATGAA AAACCCATTG ATGCAGTATT TGTGGCAATT 
GGTGGTGGCG GCTTAATTTC CGGAATTGGT GAATACATCA AAGCAGTGAG CCCAAAGACT 
AAAGTGATTG GCGTTCAAGC ATCGGACTCT GATGCCATGA ACCAATCTCT CAAAGCAAAC 
AAGCGCATTG AAATGAAAGA TGTCGGTTTA TTCTCTGACG GCACTGCAGT AAAGCTAGTA 
GGCAAAGAAA CCTTTCGCAT TTGCAAAAAA GTGGTTGATG AAATCATCAC CGTTGATACC 
GATGAAATCT GCGCAGCAAT TAATGATGTG TTCACTGATA CCCGTAGCAT CCTTGAACCA 
GCAGGCGCAC TAGCTATTGC AGGCATGAAG AAGTACGTCG AAAAGAAGCG TATTAAGAAG 
AAAACTTTAG TGGCTGTGGC TTGTGGAGCC AATATGAACT TTAGCCGCCT GCGCTTTGTA 
GCTGAACGTG CAGACGTTGG CGAGTTCCGT GAAGCGGTAT TTGCTGTCAC CATTCCTGAA 
GAGCGAGGAT CACTCAAGCG CTTTTGTGAG TTACTTGGAA AACGCAACGT TACCGAATTT 
AATTATCGAA TTGGCAACCA AAGTGAAGCA CATATTTTTG TTGGTATTAG CACGCAAAAA 
TCTGGTGATA GCGAAGTCAT TGCCAAGCAT TTCCGCAAAG CCAAATTTGC AACTATCGAT 
CTGACGCATG ATGAGTTAGC CAAGTCTCAC TTACGCCACA TGGTGGGTGG ACATTCAGCA 
CTCGCAAATG ATGAGCTGTT GTACCGCTTT GAATTTCCAG AGCGCCCAGG TGCTTTGATG 
AAGTTCTTGA CCAGCATGGC GCCCAATTGG AATATCAGCT TATTTCACTA CCGCAATCAT 
GGTGCAGACT ATGGTCGCAT TCTAGTAGGC CTACAAGTTC CTAAGAATGA GCAAAAGAAA 
TTCCAAAACT TCTTGGCTAG TCTTGGCTAT CCCCACTGGG ATGAGACCAA CAATCCTGCC 
TACCATCTCT TCCTTAAATA G

Protein sequence

MATNYLKKIL SARVYDVARE TELQVAPELT RRLGNQVLLK REDNQPVFSF KLRGAYNKMA 
HLPLEALKRG VIAASAGNHA QGVALSAAKM KCKAVIVMPV TTPSVKIDAV KARGGSWVEI 
ILHGESYSDA FKYSEVLGKK RGLTFVHPFD DPDVIAGQGT IAHEIFTQYE KPIDAVFVAI 
GGGGLISGIG EYIKAVSPKT KVIGVQASDS DAMNQSLKAN KRIEMKDVGL FSDGTAVKLV 
GKETFRICKK VVDEIITVDT DEICAAINDV FTDTRSILEP AGALAIAGMK KYVEKKRIKK 
KTLVAVACGA NMNFSRLRFV AERADVGEFR EAVFAVTIPE ERGSLKRFCE LLGKRNVTEF 
NYRIGNQSEA HIFVGISTQK SGDSEVIAKH FRKAKFATID LTHDELAKSH LRHMVGGHSA 
LANDELLYRF EFPERPGALM KFLTSMAPNW NISLFHYRNH GADYGRILVG LQVPKNEQKK 
FQNFLASLGY PHWDETNNPA YHLFLK