Gene RPD_3718 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3718
Symbol
ID	4024234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4152701
End bp	4153996
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	65%
IMG OID	637963922
Product	O-acetylhomoserine aminocarboxypropyltransferase
Protein accession	YP_570840
Protein GI	91978181
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00194867
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCGCAC CCAAACCGCC CGGATTCGAA ACGCTCAGCC TGCACGCCGG GCAACAGCCC 
GACCCGCTGA CCGGCTCGCG CGCAGTGCCG ATCTATCAGA CCACATCCTA CGTGTTTCAG 
GACACCGACC ATGCGGCCGC GCTGTTCAAC ATGGAGCGCG CCGGGCATCT GTATACGCGG 
ATCTCGAACC CGACGATCGC CGTGCTGGAA GAGCGTGTCG CCGCGCTGGA GAACGGCGTC 
GGCGCGGTGG CGACCGCGAG CGGCATGGCG GCGTTACATC TGGCGATCGC GACGCTGCTC 
AACGCCGGCG ACCACATCGT CGCCTCCAGC TCGCTCTATG GCGGCACCAT CAATCTCTTG 
ACGCACACGC TGCCGCGTTT CGGCATCACG ACCAGTTTCG TCAAGCCGCG CGATCACGCC 
GGGCTCAAAG CCGCGATCAA GCCGAACACC AGACTGGTGA TCGGCGAGAC GATCGGCAAT 
CCCGGGCTCG AAGTGCTCGA CATTCCGAAG GTCGCGGCGA TCGCCCACGA CGCGAAGATC 
CCGCTGTTGA TCGACAACAC GTTTGCGACG CCCTATTTGA GCAGACCGAT CGAGCTCGGC 
GCCGACATTG TGATGCATTC GGCGACCAAA TGGCTCGGCG GCCACGGCAT CGCGATCGGC 
GGCGTGCTGG TCGATGGCGG GCGATTCGAC TGGCGCGGCT CCGGCAAATT CCCGACACTG 
ACCGAGCCCT ATGCCGGCTA TCACGACATC GTCTTCGACG AACAGTTCGG GCCGCCGGCC 
TTTATCATCC GCGCGCGGAT GGAAGGCCTG CGTGATTTCG GCGCCTGTCT GTCGCCGACC 
AACGCGTTCC AGCTCATTCA AGGCGTCGAG ACGCTCCCGG TGCGGATGGA CCGCCATCTC 
GCGAATACCA AGGCGGTGCT CGACTTCCTC GGCGGCAACA AAGCAGTCGA GTGGGTGCTG 
CATCCGACGC TGCAGAGTCA TCCGGACTAC GCGCTGGCGA AAGAGCTGCT GCCGAAGGGC 
GCCGGTTCGA TCATATCGTT CGGCATCAAA GGCGGCCGCG CCGCGGGGCG GAAGTTCATC 
GAGGCGCTGC GGCTCACCAG CCATCTCGCC AATGTCGGCG ACGCCAAGAC GCTGGTGATC 
CATCCGGCCT CGACCACGCA TCAGCAGATG GACGCCGCGC AACTCGCGAC CGCCGGCATC 
GGCGAGGAAT TGATCCGGCT GTCGGTCGGC ATCGAGACCG CCGACGACAT CATCGCCGAC 
CTTGCGCAGG CGCTGCGCGT TTCGCAGAAG GTGTAA

Protein sequence

MAAPKPPGFE TLSLHAGQQP DPLTGSRAVP IYQTTSYVFQ DTDHAAALFN MERAGHLYTR 
ISNPTIAVLE ERVAALENGV GAVATASGMA ALHLAIATLL NAGDHIVASS SLYGGTINLL 
THTLPRFGIT TSFVKPRDHA GLKAAIKPNT RLVIGETIGN PGLEVLDIPK VAAIAHDAKI 
PLLIDNTFAT PYLSRPIELG ADIVMHSATK WLGGHGIAIG GVLVDGGRFD WRGSGKFPTL 
TEPYAGYHDI VFDEQFGPPA FIIRARMEGL RDFGACLSPT NAFQLIQGVE TLPVRMDRHL 
ANTKAVLDFL GGNKAVEWVL HPTLQSHPDY ALAKELLPKG AGSIISFGIK GGRAAGRKFI 
EALRLTSHLA NVGDAKTLVI HPASTTHQQM DAAQLATAGI GEELIRLSVG IETADDIIAD 
LAQALRVSQK V