Gene RPB_1001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1001
Symbol
ID	3909298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1146374
End bp	1147678
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	66%
IMG OID	637882894
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_484622
Protein GI	86748126
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAACG AGACGATCGC CATTCACGCC GGCTACGATC CCGATCCGAC CACCAAGGCG 
GTCGCGGTCC CGATCTACCA GACCGCATCC TACGCCTTCG ACAGCGCCGA CCACGGCGCC 
GCATTGTTCA ATCTCGAGAC CGAAGGCTAT CGCTATTCGC GGATCGCCAA TCCGACCAGC 
GCTGTGCTGG AGAAGCGCGT CGCCGAGCTC GAGGGTGGCG TCGGCGCGCT CGCGGTCGCC 
AGCGGCCAGG CGGCGCTGCA CTACGCCTTC GTCAACGTCG CCGATCACGG CGGCAACATC 
GTCTCGGTGC CGCAGCTCTA CGGCACCACG CACACGCTGC TCTCCCACAT CCTGCCGCGC 
CAGGGCATCC ACGGCCGCTT CGCCGAGAAC GACAGTGCCG CGGCGATCGA GAAGCTCATC 
GATGCCGATA CCCGCGCGGT GTTCTGCGAG ACCATCGGCA ATCCCGCCGG CAATGTCTGC 
GATATCGAGC GCATCGCCGA GGTGGCGCAT CGGCACGGCG TGCCGCTGAT CGTCGACAAC 
ACGGTGGCGA CGCCGATCCT GATGAAGCCG TTCGACCACG GCGCCGACAT CGTGGTGCAT 
TCGCTGACCA AGTTCCTCGG CGGCCACGGC ACGACGCTGG GCGGCGCGAT CGTCGACAGC 
GGCCGGTTCG ACTGGGCGGC GCAGCCGCAG CGCTTTCCGG CGTTCAACCA GCCCGATCAT 
TCCTATCACG GCATGGTCTA TGCCGAGCGG TTCGGCCCGA CGGCCTATAT CGAGCGCGCC 
CGCAGCATCT ATCAGCGCAC CATGGGGTCG GTGCTGTCGC CGTTCAATGC GTTCCTGCTG 
CTGCAGGGCA TCGAGACCGT CGCGCTGCGG ATGGAACGCC ACGTCGAGAA CGCCCGCAAG 
GTGGCGGAGT TCCTGCGCGA CGATCCGCGC GTCGCCTGGG TGAACTACAC CGGCTTCCCG 
GACAGTCCGT ATTACGAGCT GGTGCAGAAA TATCTCGGCG GCCGGGCGTC GTCGCTGTTC 
ACCTTCGGCA TCAAGGGCGG CCTCGAGGCC GGCAAGAATT TCTACGATTC GCTGCGGCTG 
ATCACCCGGC TGGTCAATAT CGGCGACGCC AAATCGCTCG CCTGCCATCC GGCCTCGACC 
ACGCATCGGC AGATGTCCGC CGAGCAGCAG CGCACCGCCG GCGTGCTGCC GGAGACGATC 
CGGCTGTCGA TCGGCATCGA ACACATCGCC GACATCATCG AAGATCTCGA TCAGGCGCTG 
GCGCAGGCCG GTGGCCGGCG CACGCAACTG ATCGCGGCGG AATAA

Protein sequence

MRNETIAIHA GYDPDPTTKA VAVPIYQTAS YAFDSADHGA ALFNLETEGY RYSRIANPTS 
AVLEKRVAEL EGGVGALAVA SGQAALHYAF VNVADHGGNI VSVPQLYGTT HTLLSHILPR 
QGIHGRFAEN DSAAAIEKLI DADTRAVFCE TIGNPAGNVC DIERIAEVAH RHGVPLIVDN 
TVATPILMKP FDHGADIVVH SLTKFLGGHG TTLGGAIVDS GRFDWAAQPQ RFPAFNQPDH 
SYHGMVYAER FGPTAYIERA RSIYQRTMGS VLSPFNAFLL LQGIETVALR MERHVENARK 
VAEFLRDDPR VAWVNYTGFP DSPYYELVQK YLGGRASSLF TFGIKGGLEA GKNFYDSLRL 
ITRLVNIGDA KSLACHPAST THRQMSAEQQ RTAGVLPETI RLSIGIEHIA DIIEDLDQAL 
AQAGGRRTQL IAAE