Gene Rpal_1757 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1757
Symbol
ID	6409414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	1885931
End bp	1887226
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	66%
IMG OID	642711645
Product	O-acetylhomoserine aminocarboxypropyltransferase
Protein accession	YP_001990760
Protein GI	192290155
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGCAC CCAAACCGCC CGGATTTGAA ACCCTCAGCC TGCACGCCGG GCAACATCCC 
GATCCGCTGA CCGGCTCGCG CGCGGTGCCG ATCTATCAGA CCACGTCCTA CGTGTTTCAG 
GACACCGACC ACGCCGCGGC GCTGTTCAAT ATGGAGCGGC CCGGCCACCT CTACACGCGG 
ATCTCCAACC CGACGATCGC GGTGCTGGAA GAGCGGATCG CCGCGCTGGA GAACGGCGTC 
GGCGCGGTGG CGACCGCCAG CGGCATGGCG GCGCTGCATC TGGCGATCGC GACGCTGCTG 
AATGCCGGCG ATCACATCGT CGCGTCGTCG TCGCTGTACG GCGGCACGAT CAACCTCTTG 
GCGCACACGC TGCCGCGGTT CGGCATCACC ACCACCTTCG TGGCGCCTCG CGACCACGCC 
GGCCTCGCAG CGGCGATCCA GCCGAACACC AGGCTGGTGA TCGGCGAGAC CATCGGCAAT 
CCGGGCCTCG AAGTGCTCGA CATCCCGAAG GTCGCGGCCA TCGCCCATGA GGCGAAAATC 
CCGCTCTTGA TCGACAACAC CTTCGCGACG CCGTACCTCA GCAAGCCGAT CGAGCTCGGC 
GCCGACATCG TGATGCATTC GGTCACAAAA TGGCTCGGCG GCCACGGCAT CGCCATCGGC 
GGCGTGCTGG TCGACGGCGG CCGGTTCGAC TGGCGCGGCT CCGGCAAGTT TCCGACGCTG 
ACCGAGCCCT ACGCCGGCTA TCACGACGTC GTCTTCGACG AGCAGTTCGG CCCGCCCGCT 
TTCGTCATTC GCGCGCGGAT GGAAGGTCTG CGCGATTTCG GCGCCTGCCT GTCGCCGACC 
AACGCTTTCC AGCTGCTGCA GGGCATCGAG ACGCTGCCGG TTCGGATGGA TCGGCATGTC 
GCCAACACCA AGGCGGTGCT CGACTTCCTT CAGACCAACA AGGCGGTCGA TTGGGTTCTG 
CATCCGACGC TGGACAACCA CCCCGACTAC GAACTGGCAA AGACGCTGCT GCCGAACGGC 
GCCGGCTCGA TCATCTCGTT CGGCATCAAG GGCGGCCGTG CCGCCGGGCG CAAGTTCATC 
GAGGCGCTGC GGCTGACCAG CCATCTCGCC AATGTCGGCG ACGCCAAGAC GCTGGTGATC 
CATCCGGCAT CGACCACGCA TCAGCAGATG AGCGCCGAGC AGCTCGAGGC CGCCGGCATC 
GGTGAAGAGC TGATCCGGCT GTCGGTCGGC ATCGAAACCG CCGACGACAT TATCGCTGAC 
CTGGCGCAGG CGCTGCGCGT TTCGCAGAAG GGCTGA

Protein sequence

MAAPKPPGFE TLSLHAGQHP DPLTGSRAVP IYQTTSYVFQ DTDHAAALFN MERPGHLYTR 
ISNPTIAVLE ERIAALENGV GAVATASGMA ALHLAIATLL NAGDHIVASS SLYGGTINLL 
AHTLPRFGIT TTFVAPRDHA GLAAAIQPNT RLVIGETIGN PGLEVLDIPK VAAIAHEAKI 
PLLIDNTFAT PYLSKPIELG ADIVMHSVTK WLGGHGIAIG GVLVDGGRFD WRGSGKFPTL 
TEPYAGYHDV VFDEQFGPPA FVIRARMEGL RDFGACLSPT NAFQLLQGIE TLPVRMDRHV 
ANTKAVLDFL QTNKAVDWVL HPTLDNHPDY ELAKTLLPNG AGSIISFGIK GGRAAGRKFI 
EALRLTSHLA NVGDAKTLVI HPASTTHQQM SAEQLEAAGI GEELIRLSVG IETADDIIAD 
LAQALRVSQK G