Gene Pnuc_1550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnuc_1550
Symbol
ID	5052508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. asymbioticus QLW-P1DMWA-1
Kingdom	Bacteria
Replicon accession	NC_009379
Strand	-
Start bp	1619764
End bp	1621104
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	47%
IMG OID	640471723
Product	SAF domain-containing protein
Protein accession	YP_001156328
Protein GI	145589731
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4091] Predicted homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000710074
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCTTA TTCAGAAGTT GAAGGCGCGT GCTGCCAATA ACAATCCTGT GCGTGTAGGT 
GTGATTGGAG CAGGCAAGTT TGGTTCGATG TATCTTTCCC AGGCACCTCG TACTCCCGGC 
ATACATTTAG TAGCCGTTGC CGACTTATCT CCAGCGCGTG CAAAAGAATC ATTGGCTCGT 
GTAGGTTGGG ATACACCTCG TTATAGCGCT ACATCAATGC AAGATGCTGC TAAATCAGGC 
GCTACTTTTG TGACTGATGA TGCAGAAAAG ATGATTGCTA GTGAGTACAT CGACATCGTG 
ATTGATGCTA CCGGGAGTCC AGCTGCTGGT ATTCGTCATG CATTGCTTTG TTTTGATCAT 
CGCAAACATA TCATTATGGT CAACGTAGAG GCTGACGTGT TGGCTGGCCC ATTGTTAGCG 
CGTAAGGCAG CAGAGGCTGG GGTCATTTAC TCCATGGCTT CTGGTGATCA ACCAGCTCTC 
ATTGCTGAAC TAGTTGATTG GGCTAGAACG ATTGGCCTTG AAGTAGTGTG CGCTGGTAAG 
GGCACTAAGT ATTTGCCTAT CTATCACCAG TCCACTCCAG ATACTGTCTG GGGGCACTAC 
GGATTTTCTG AAGAGCAGGT GGCTGGTGGC GACTTTAATG CACAAATGTT CAACTCATTC 
TTGGATGGCA CTAAATCAGC GTTAGAAATG GCGGCAGTAT CGAATGGTTG CGATTTAACG 
CCTCCAAGCA ATGGCTTGGA ATTTCCACCT TGCGGGGTTG ATGATTTACC GCACATCTTT 
CGCCCCATAT CTGAGGGTGG AATTCTGAAG CAAAAAGGAA CTGTAGAGGT AGTCTCTTCA 
GTTGAAAGAG ACGGTCGCCC AGTATTTAGA GATTTACGTT GGGGTGTATT TGCAGTGTTT 
GAGGCACCGA GCCAATATGT TATTGATTGC TTCTCGCAAT ATGGCTTAAA GACCGATAGC 
ACTGGTAAAT ATGCAGCAAT GTATAAGCCT TATCACCTTA TAGGCTTAGA ACTTGGTATC 
TCAGTTGCGA GTATTGCCGT ACGTGGCGAA GCTACAGGCG CTACAGGTGA TTGGAGGGGT 
GATGTGGTTG CCACCACTAA GCGTGCACTG AAAGCGGGCG AAAAATTAGA TGGAGAGGGC 
GGTTTTACCG TTTACGGCAA ACTCATGACA GCTGCTGATT CCTTAAAACT CGGCGCTCTA 
CCAATTGGTC TGGCACACAA CATGGCTCTG AAAAGAGATA TTCCTGCGGG AAAACCAGTT 
TGCTGGAGTG ATGTTGACTA CGATGCCACT AAGCAAGCAA TAGCGTTCCG TAGGGAAATG 
GAAACAGTAT TTGGTAAATA G

Protein sequence

MSLIQKLKAR AANNNPVRVG VIGAGKFGSM YLSQAPRTPG IHLVAVADLS PARAKESLAR 
VGWDTPRYSA TSMQDAAKSG ATFVTDDAEK MIASEYIDIV IDATGSPAAG IRHALLCFDH 
RKHIIMVNVE ADVLAGPLLA RKAAEAGVIY SMASGDQPAL IAELVDWART IGLEVVCAGK 
GTKYLPIYHQ STPDTVWGHY GFSEEQVAGG DFNAQMFNSF LDGTKSALEM AAVSNGCDLT 
PPSNGLEFPP CGVDDLPHIF RPISEGGILK QKGTVEVVSS VERDGRPVFR DLRWGVFAVF 
EAPSQYVIDC FSQYGLKTDS TGKYAAMYKP YHLIGLELGI SVASIAVRGE ATGATGDWRG 
DVVATTKRAL KAGEKLDGEG GFTVYGKLMT AADSLKLGAL PIGLAHNMAL KRDIPAGKPV 
CWSDVDYDAT KQAIAFRREM ETVFGK