Gene PP_2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PP_2001
Symbol	metZ
ID	1043012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas putida KT2440
Kingdom	Bacteria
Replicon accession	NC_002947
Strand	+
Start bp	2269195
End bp	2270406
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	63%
IMG OID	637145411
Product	O-succinylhomoserine sulfhydrylase
Protein accession	NP_744151
Protein GI	26988726
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGATC AATGGGATGC CGGGCGACTG GACAGTGACC TCGAGGGTGT CGGTTTCGAC 
ACCCTGGCGG TACGCGCTGG CCAAAACCGT ACCCCGGAAG GCGAGCACAG CGAAGCGCTG 
TTCCTGACCT CCAGCTATGT GTTCCGCACG GCAGCCGATG CTGCTGCGCG CTTTGCCGGC 
GAAACGCCGG GCAACGTCTA CTCGCGCTAC ACCAACCCGT CGGTGCGTGC CTTCGAGGAG 
CGCCTGGCGG CCATGGAAGG TGCCGAACAG GCCGTGGGTA CGTCCACCGG CATGGCGGCG 
ATCCTGGCCG TGGTCATGTC GCTGTGCAGC GCCGGTGACC ATGTGCTGGT GTCGCAGAGC 
GTATTCGGCT CCACCATCAG CCTGTTCGAG AAGTACTTCA AGCGCTTTGG TGTAGAAGTG 
GACTACGTGC CACTGGTCGA CCTCACCGGT TGGGAAAAGG CCATCAAGGC CAACACCAAG 
CTGCTGATCG TCGAATCGCC CTCCAACCCG CTGGCCGAGT TGGTCGATAT CACCGCGCTC 
AGCGAAATCG CCCATGCTCA GGGTGCCATG CTGGTGGTGG ACAACTGTTT CAGTACCCCG 
GCGTTGCAGC AGCCGCTGAA GCTGGGTGCC GACATTGTGT TCCACTCGGC CACCAAGTTC 
ATCGACGGCC AGGGCCGCTG CATGGGCGGT GTGGTTGCCG GCCGTACTGA GCAAATGAAA 
GAAGTGGTGG GTTTCCTGCG AACCGCAGGT CCAACCCTCA GCCCGTTCAA CGCCTGGATC 
TTCACCAAGG GCCTGGAAAC GCTGCGCCTG CGTATGCGTG CGCACTGCGA AAGCGCTCAG 
GCCCTGGCCG AATGGCTGGA GCAGCAGGAC GGCGTGGAGA AGGTGCATTA CGCCGGCCTG 
CCCAGCCACC CGCAGCACGA ACTGGCCAAG CGCCAGATGA GCGGTTTTGG TGCAGTGGTC 
AGCTTTGAAG TCAAGGGGGG CAAAGAGGGC GCCTGGCGTT TCATCGACGC TACCCGAGTG 
ATTTCCATCA CGACCAACCT GGGTGACAGC AAAACCACCA TCGCTCATCC GGCGACCACC 
TCACACGGTC GTCTGTCGCC GCAGGAGCGT GAAGCGGCTG GTATCCGCGA CAGCCTGATC 
CGTGTTGCCG TGGGTCTGGA AGACGTGGCT GACCTGCAGG CTGACCTGGC GCGCGGGCTG 
GCGGCATTGT GA

Protein sequence

MTDQWDAGRL DSDLEGVGFD TLAVRAGQNR TPEGEHSEAL FLTSSYVFRT AADAAARFAG 
ETPGNVYSRY TNPSVRAFEE RLAAMEGAEQ AVGTSTGMAA ILAVVMSLCS AGDHVLVSQS 
VFGSTISLFE KYFKRFGVEV DYVPLVDLTG WEKAIKANTK LLIVESPSNP LAELVDITAL 
SEIAHAQGAM LVVDNCFSTP ALQQPLKLGA DIVFHSATKF IDGQGRCMGG VVAGRTEQMK 
EVVGFLRTAG PTLSPFNAWI FTKGLETLRL RMRAHCESAQ ALAEWLEQQD GVEKVHYAGL 
PSHPQHELAK RQMSGFGAVV SFEVKGGKEG AWRFIDATRV ISITTNLGDS KTTIAHPATT 
SHGRLSPQER EAAGIRDSLI RVAVGLEDVA DLQADLARGL AAL