Gene RPB_4252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4252
Symbol	metX
ID	3912065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4837799
End bp	4839001
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	67%
IMG OID	637886157
Product	homoserine O-acetyltransferase
Protein accession	YP_487851
Protein GI	86751355
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.647342
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAATG TACACCCGGT GAAAGGTCCC GTTGCGACCG GTGGCGAGCG CCCCCACGAG 
GCCGACCATC CGACGTCGCT GGTGGCGTCG TTCGGCGCCG ACCAGCCGCT GCGGCTCGAT 
TGCGGCGTCG ACCTCGCCCC GTTCCAGATC GCCTACCAGA CCTATGGCAC GCTGAACGCC 
GACAAGAGCA ACGCCATTCT GGTCTGCCAT GCGCTGACCA TGGACCAGCA CATCGCCAAT 
GTGCATCCGA TCACCGGCAA GCCGGGCGGA TGGCTGACGC TGGTCGGTCC CGGCAAGCCG 
ATCGACACCG ACCGCTATTT CGTCATCTGC TCCAACGTGA TCGGCAGTTG CATGGGCTCG 
ACCGGTCCGG CCTCGACCAA TCCGGCCACC GGCAAGGTCT GGGGCCTCGA TTTTCCCGTC 
ATCACCATCC CCGACATGGT CCGCGCCCAG GCGATGCTGG TCGACCGGCT CGGCATCGAC 
AAATTGTTCT GCGTCGTCGG CGGCTCGATG GGCGGCATGC AGGTGCTGCA ATGGAGCGTC 
GCCTATCCGG AGCGGGTGTT CTCGGCGATG CCGATCGCCT GCGCGACGCG GCATTCGGCG 
CAGAACATCG CCTTCCACGA GCTCGGCCGC CAGGCGGTGA TGGCCGATCC GGACTGGGCC 
CATGGCCGCT ATGTCGAGAC CGGCGCGCAT CCGCATCGCG GCCTCGCGGT GGCGCGGATG 
GCCGCGCACA TCACCTATCT GTCCGACGCC GCCTTGCACC GCAAGTTCGG CCGCAGGATG 
CAGGACCGCG AACTGCCGAC GTTCTCGTTC GACGCCGACT TCCAGGTCGA GAGCTATCTG 
CGCTATCAGG GCTCGTCCTT CGTCGAGCGC TTCGACGCCA ACTCTTATCT CTATCTGACC 
CGCGCGATGG ATTATTTCGA CATCGCCGCC GACCATCACG GCGTGCTGGC GGCGGCGTTC 
CGCGGCACCC AGACGCGGTT CTGCGTGGTG TCGTTCACCT CCGACTGGCT GTTCCCGACG 
CCGGAATCGC GCGCGATCGT GCATGCGCTC AACGCCGGCG GCGCGCGGGT GTCGTTCGCC 
GAAGTCGAGA CCGACAAAGG CCACGACGCC TTTCTGCTCG ACGAGCCGGA ATTCATCGAC 
ATCGCCCGCG CCTTCCTGCA CTCGGCTGCG ACCGCGCGCG GGCTCGACAA AGCGGGGCGC 
TGA

Protein sequence

MMNVHPVKGP VATGGERPHE ADHPTSLVAS FGADQPLRLD CGVDLAPFQI AYQTYGTLNA 
DKSNAILVCH ALTMDQHIAN VHPITGKPGG WLTLVGPGKP IDTDRYFVIC SNVIGSCMGS 
TGPASTNPAT GKVWGLDFPV ITIPDMVRAQ AMLVDRLGID KLFCVVGGSM GGMQVLQWSV 
AYPERVFSAM PIACATRHSA QNIAFHELGR QAVMADPDWA HGRYVETGAH PHRGLAVARM 
AAHITYLSDA ALHRKFGRRM QDRELPTFSF DADFQVESYL RYQGSSFVER FDANSYLYLT 
RAMDYFDIAA DHHGVLAAAF RGTQTRFCVV SFTSDWLFPT PESRAIVHAL NAGGARVSFA 
EVETDKGHDA FLLDEPEFID IARAFLHSAA TARGLDKAGR