Gene RPB_3960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3960
Symbol
ID	3911767
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4521429
End bp	4522730
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	65%
IMG OID	637885864
Product	O-acetylhomoserine aminocarboxypropyltransferase
Protein accession	YP_487564
Protein GI	86751068
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.993193
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCATGG CCGCTCCAAA ACCGCCCGGA TTCGAGACAC TTAGCCTGCA CGCCGGGCAA 
CACCCCGACC CGCTGACCGG CTCGCGCGCG GTGCCGATCT ATCAGACCAC GTCCTACGTC 
TTCCAGGACA CCGACCACGC CGCCGCTTTG TTCAACATGG AGCGGCCCGG GCATCTCTAC 
ACGCGCATCT CCAACCCGAC CACCGCGGTG CTGGAAGAGC GTATCGCCGC GCTCGAAAAC 
GGCGTCGGCG CGGTCGCCAC CGCGAGCGGC ATGGCGGCGC TGCATCTGGC GATCGCGACG 
CTGCTCAACG CCGGCGATCA CATCGTCGCG TCGTCGTCGC TGTACGGCGG CACGATCAAC 
CTTCTCGCGC ACACGCTGCC GCGCTTCGGC ATCACCACGA CTTTTGTGAA GCCGCGCGAC 
CACGACGGCC TCGCGGCCGC CATCAAGCCG AATACGCGGC TGATGATCGG TGAGACCATC 
GGCAATCCCG GCCTCGAAGT GCTCGACATT CCGAAGGTCG CGGCGATTGC GCATGAGGCT 
AAGATCCCCT TGCTGATCGA CAACACCTTT GCGACGCCCT ATCTGAGCCA GCCGATCGCG 
CTCGGCGCCG ATATCGTGAT GCATTCGGCG ACCAAATGGC TCGGCGGCCA CGGCATCGCG 
ATCGGCGGCG TGTTGGTCGA CGGCGGCCGT TTCGACTGGC GCGGCTCGGG CAAATTCCCG 
ACGCTGACCG AACCCTATGC CGGCTATCAC GACATCGTCT TCGACGAACA ATTCGGGCCG 
CCGGCCTTTA TCATTCGCGC GCGAATGGAA GGGCTGCGCG ACTTTGGAGC TTGTCTGTCG 
CCGACCAATG CGTTCCAGCT GCTGCAGGGC GTGGAAACGC TGTCGGTGCG GATGGATCGG 
CACGTCGCCA ACACCGCAGC GGTGCTCGAC TTTCTCGGCG GCAACAAGGC GGTCGAGTGG 
GTGCTGCATC CGACGCTGGA AAGCCATCCG GACTACGCAC TCGCGAAAGA GCTGCTGCCG 
AAGGGCGCCG GCTCGATCGT CTCGTTCGGC ATCAAGGGCG GCCGCGCCGC CGGGCGCAAA 
TTCATCGAAG CGCTCAAGCT GACCAGCCAC CTCGCCAATG TCGGCGACGC CAAGACGCTG 
GTGATCCACC CGGCCTCGAC GACGCATCAG CAGATGAGCG CGGAGCAGTT GACGGCCGCC 
GGGATCGGTG AGGAACTGAT CCGCCTCTCG GTCGGGATCG AAACCGCCGA CGACATCATC 
GCTGATCTGG CGCAGGCGCT GCGCATTTCG CAGAAGGGCT GA

Protein sequence

MLMAAPKPPG FETLSLHAGQ HPDPLTGSRA VPIYQTTSYV FQDTDHAAAL FNMERPGHLY 
TRISNPTTAV LEERIAALEN GVGAVATASG MAALHLAIAT LLNAGDHIVA SSSLYGGTIN 
LLAHTLPRFG ITTTFVKPRD HDGLAAAIKP NTRLMIGETI GNPGLEVLDI PKVAAIAHEA 
KIPLLIDNTF ATPYLSQPIA LGADIVMHSA TKWLGGHGIA IGGVLVDGGR FDWRGSGKFP 
TLTEPYAGYH DIVFDEQFGP PAFIIRARME GLRDFGACLS PTNAFQLLQG VETLSVRMDR 
HVANTAAVLD FLGGNKAVEW VLHPTLESHP DYALAKELLP KGAGSIVSFG IKGGRAAGRK 
FIEALKLTSH LANVGDAKTL VIHPASTTHQ QMSAEQLTAA GIGEELIRLS VGIETADDII 
ADLAQALRIS QKG