Gene Rpal_0966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0966
Symbol
ID	6408620
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	1033778
End bp	1034695
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	68%
IMG OID	642710880
Product	dihydrodipicolinate synthase
Protein accession	YP_001989999
Protein GI	192289394
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR00674] dihydrodipicolinate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.318668
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGACAT CCCTGGACGC GACAGCCGAA CAGCCACGCG GGCTGTGGCT GCCGCTGATC 
ACGCCGTTTC GCGACGGCGA GCTCGACGGC GCATCGCTGC GCCGGCTGAT CGCGCACTAC 
GCGCGAGCTC CGCTCGACGG ACTGATCTTA GGGGCCACCA CCGGCGAAGG GCTGACGCTG 
AATGAAGACG AGCTCGAACG CCTGGTGATG CTGAGCGCCG ATGCATTGGC GGCGAGCGGC 
CGCAAGCTGC CGGTGTATCT CGGGCTGTCC GGCAGCGACA CGCGCAAGCT GGTGAAGACG 
CTGGCGCGGA CCGCACACTG GCCGATCGAC GGCGTGCTGA TCGCCTGCCC GTACTACACC 
CGCCCGTCGC AGCGGGGATT GGTGCTGCAT TTCGAAGCCG CAGCCGACGC CACCGCAAGG 
CCGATCCTGA TCTACAACAT CCCGTATCGC ACCGGCGTCA ATCTACACAA CGAGGCGATG 
CTGCGGCTCG CCGAGCGCGC CAACATCGTC GGCGTCAAGG ATTGCTGCGC CGATCCTGCG 
CAGACAGCGG AGCTGCTGAG GTTGCGGCCG CCGGGCTTTT CGGTGCTCAC CGGCGAGGAT 
GCGCTGGCAT TCGATGCGCT GAGCCGCGGC TGCGACGGCG CGATCCTGGC CTCGGCGCAT 
CTGGAGACCG AGGCGTTCGC CGCGATGATG CATCGGCTGC AGGCCGGCGA CCGCCTCGGT 
GGGGCGACCG AATGGCAACG GCTCGCCGAC CTGCCGAAGC TGCTGTTCGC CGAGCCATCC 
CCGGCGCCGG TGAAATATGC GCTGTGGCGG CGCGGGTTGA TCGACAGCCC AGAAGTGCGG 
CTGCCGATGA CACCGGTGTC GCCCACGCTC GCCGCCACCC TTGATGCGTG GATGCTGCCC 
GGCCTATCCG CGGCTTGA

Protein sequence

METSLDATAE QPRGLWLPLI TPFRDGELDG ASLRRLIAHY ARAPLDGLIL GATTGEGLTL 
NEDELERLVM LSADALAASG RKLPVYLGLS GSDTRKLVKT LARTAHWPID GVLIACPYYT 
RPSQRGLVLH FEAAADATAR PILIYNIPYR TGVNLHNEAM LRLAERANIV GVKDCCADPA 
QTAELLRLRP PGFSVLTGED ALAFDALSRG CDGAILASAH LETEAFAAMM HRLQAGDRLG 
GATEWQRLAD LPKLLFAEPS PAPVKYALWR RGLIDSPEVR LPMTPVSPTL AATLDAWMLP 
GLSAA