Gene Pfl01_1903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pfl01_1903
Symbol
ID	3716320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas fluorescens Pf0-1
Kingdom	Bacteria
Replicon accession	NC_007492
Strand	+
Start bp	2174331
End bp	2175542
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	63%
IMG OID
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_347635
Protein GI	77458130
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAGG AATGGGATGC CGGTCGGCTG GACAGCGACC TCGAAGGCGT AGCGTTCGAT 
ACCCTGGCCG TACGTGCCGG TCAGCACCGT ACGCCGGAAG GCGAGCACGG TGATCCGATG 
TTCTTCACTT CCAGCTATGT GTTTCGCACC GCCGCCGATG CGGCTGCGCG GTTTGCCGGG 
GAAGTGCCGG GCAACGTCTA CTCGCGTTAC ACCAACCCGA CCGTTCGCGC CTTCGAAGAG 
CGCATTGCCG CGCTGGAAAG CGCCGAGCAG GCGGTGGCCA CGGCCACCGG CATGGCCGCG 
ATCATGGCTG TGGTGATGAG CCTGTGCAGC GCCGGCGACC ATGTGCTGGT GTCGCGCAGT 
GTGTTCGGTT CGACCATCAG CCTGTTCGAG AAGTATTTCA AGCGTTTTGG CGTGGAAGTC 
GATTACGTGC CGCTGGCCGA TCTGTCGGCC TGGGGCGCAG CGATCAAGTC CAACACCAAA 
TTGCTGTTCG TCGAGTCGCC GTCCAATCCG TTGGCTGAAC TGGTGGATAT CACCGCTCTG 
TCGGAAATCG CGCACGCCAA GGGTGCGATG CTGGTAGTCG ACAACTGCTT CTGCACGCCT 
GCCTTGCAGC AGCCGCTGAA GCTGGGCGCA GACATCGTTG TGCATTCGGC CACCAAGTTC 
ATCGATGGCC AGGGCCGTTG CATGGGCGGC GTGGTTGCCG GTCGCAGCGA ACAGATGAAA 
GAAGTCGTCG GCTTCCTGCG TACCGCCGGG CCGACCCTCA GCCCGTTCAA CGCCTGGATC 
TTCCTCAAGG GGCTGGAAAC CCTGAACCTG CGGATGAAGG CGCACTGCGC CAATGCCCAA 
CAACTGGCTG AGTGGCTGGA GCAGCAGGAT GGCATCGAGA AGGTGCATTA CGCCGGTCTC 
AAGAGCCATC CGCAGCACGA ACTGGCTCAG CGTCAGCAGA AGGGCTTCGG CGCGGTGGTG 
AGCTTTGAGG TCAAGGGCGG CAAAGAGGGT GCCTGGCGTT TCATCGATGC GACCCGTTTG 
ATCTCGATTA CTGCCAACCT CGGTGACAGC AAAACCACCA TCACCCACCC GAGCACCACG 
TCCCATGGCC GTCTGGCGCC GCAGGAGCGT GAGGCAGCCG GCATTCGTGA CAGCCTGATC 
CGCATCGCGG TCGGTCTGGA AGACGTGGCT GACCTGCAAG CCGACCTGTC GCGCGGTCTG 
GCGGCGTTGT GA

Protein sequence

MSQEWDAGRL DSDLEGVAFD TLAVRAGQHR TPEGEHGDPM FFTSSYVFRT AADAAARFAG 
EVPGNVYSRY TNPTVRAFEE RIAALESAEQ AVATATGMAA IMAVVMSLCS AGDHVLVSRS 
VFGSTISLFE KYFKRFGVEV DYVPLADLSA WGAAIKSNTK LLFVESPSNP LAELVDITAL 
SEIAHAKGAM LVVDNCFCTP ALQQPLKLGA DIVVHSATKF IDGQGRCMGG VVAGRSEQMK 
EVVGFLRTAG PTLSPFNAWI FLKGLETLNL RMKAHCANAQ QLAEWLEQQD GIEKVHYAGL 
KSHPQHELAQ RQQKGFGAVV SFEVKGGKEG AWRFIDATRL ISITANLGDS KTTITHPSTT 
SHGRLAPQER EAAGIRDSLI RIAVGLEDVA DLQADLSRGL AAL