Gene Pnuc_1779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnuc_1779
Symbol
ID	5053488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. asymbioticus QLW-P1DMWA-1
Kingdom	Bacteria
Replicon accession	NC_009379
Strand	+
Start bp	1855553
End bp	1856677
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	44%
IMG OID	640471952
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001156556
Protein GI	145589959
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAAC AAAATACGAA TCCCGCCAAT TGGTACTCCG CTGTAGACAA AACATCGGAT 
ACCGACGATC AACGCATTGA CAATATCTCC GTTCTGCCTC CGCCAGAACA TTTGATTCGT 
TTCTTTCCTA TTTCAGGAAC TCCAACCGAA TCGTTAATTA GCAATACTCG CAAAAAGATT 
CGGGACATTA TTCATGGAAA AGATGATCGC CTATTAGTGA TCATTGGACC TTGCTCAATT 
CATGATCCAA AAGCAGCGCT CGAATATTGC CAGCGTCTTT TGAGAGAGCG CGATCGCTTT 
GCAGGCGAAT TAGAAATTGT GATGCGCGTG TACTTTGAAA AGCCACGTAC TACTGTTGGC 
TGGAAGGGTT TGATTAATGA CCCTTACTTG GATGAAAGCT ATCGTATTGA AGAAGGTTTA 
CGTTTAGCTC GCCAAGTGTT GATGGAAATT AATCGCCTTG GTATGCCAGC AGGCAGCGAA 
TTTCTTGATG TGATTTCTCC GCAATATATT GCTGATCTGA TTTCTTGGGG AGCGATTGGT 
GCTCGCACTA CCGAGAGTCA GGTTCACCGT GAGCTTGCAT CTGGATTGTC CGCTCCAATT 
GGCTTTAAAA ATGGCACCGA TGGCAATATC AAAATTGCTA CCGACGCTAT CCAAGCAGCA 
GGACGTCCAC ACCATTTCTT GTCAGTGCAT AAAAACGGTC AAGTATCTGT GGTTGAAACA 
AAAGGGAATA AAGACTGCCA CGTTATTTTG CGTGGTGGTA AAGAGCCTAA TTATGAAGCG 
AAATTTGTAC AGGAAGCCTG CTCTGAGCTC GAAACTGCAA AGCTTCCAGC CAGCTTGATG 
GTGGATTTAT CTCATGCGAA TTCAAGTAAA AAACATGAGC GTCAAATTAT TGTGGCCGAC 
GACGTTGCAC AGCAAATTGA ATCTGGATCA CATCAGATCT TTGGTGTGAT GGTGGAAAGT 
CATTTGAATG ACGGCGCACA AAAATTCACG CCCGGAAAAG ATGACCCTAG CAATTTGGAG 
TATGGCAAAA GTATTACTGA TGCCTGCATC AATTGGGATG ACTCTGTAAA AGTATTGGAG 
CGTCTTGCTG GAGCAGTAAA AAAACGTAGA AGCAATAAGA AGTAA

Protein sequence

MSQQNTNPAN WYSAVDKTSD TDDQRIDNIS VLPPPEHLIR FFPISGTPTE SLISNTRKKI 
RDIIHGKDDR LLVIIGPCSI HDPKAALEYC QRLLRERDRF AGELEIVMRV YFEKPRTTVG 
WKGLINDPYL DESYRIEEGL RLARQVLMEI NRLGMPAGSE FLDVISPQYI ADLISWGAIG 
ARTTESQVHR ELASGLSAPI GFKNGTDGNI KIATDAIQAA GRPHHFLSVH KNGQVSVVET 
KGNKDCHVIL RGGKEPNYEA KFVQEACSEL ETAKLPASLM VDLSHANSSK KHERQIIVAD 
DVAQQIESGS HQIFGVMVES HLNDGAQKFT PGKDDPSNLE YGKSITDACI NWDDSVKVLE 
RLAGAVKKRR SNKK