Gene Pnap_4102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_4102
Symbol	metX
ID	4688687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	-
Start bp	4387713
End bp	4388822
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	62%
IMG OID	639837114
Product	homoserine O-acetyltransferase
Protein accession	YP_984313
Protein GI	121606984
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.23189
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTTTG CCGACGTCCT GCCCTTGCGC AGCGGCGCCT CGATTCGCGC CTATGACCTG 
AGCTATGAAA CCTATGGCCA GCTCAACGCC GACAAGTCCA ACGCGGTGCT GATCTGCCAT 
GCGCTGAACG CGTCGCACCA TGTGGCCGGC GTTTACCTGG ACGAATCCGG CCAGATTCAG 
AAAAAATCCG AAGGCTGGTG GGACACCATG ATCGGCCCGG GCAAGCCGGT CGATACCAAC 
CGGTTTTTTG TCATCGGCGT GAACAACCTC GGTTCGTGCT TCGGCTCGAC CGGGCCGATG 
CAGACCAACC CCGACACGAA TGAGGTGTAC GGCGCCGATT TCCCGGTCGT CACGGTGCAG 
GACTGGGTTG ATGCGCAGGC CAGATTGCTC GATGCGCTGG GCATCCAGAC GCTGGCCGCC 
GTCATGGGCG GCAGCCTGGG CGGCATGCAG GCGCTGAGCT GGACGCTGCA ATACCCCGGG 
CGTGTCCGCC ATGCGGTGGT GGTGGCCAGC GCGCCCAACC TGACCGCCGA GAACATTGCC 
TTCAACGAAG TCGCGCGCCG CGCCATCGTC ACCGACCCCG ACTTTCACGG CGGACATTTT 
TACAAACACG GCGTGCTGCC CAAGCGCGGC CTGCGCATTG CCCGCATGAT CGGCCACATC 
ACCTACCTGA GCGACGACGT GATGAACGAG AAGTTCGGAC GCCAGCTGCG CGACGCCGCA 
GGCATCAAGT TTTCGACGCA GGACGTCGAG TTCCAGATCG AAAGCTACCT GCGCTACCAG 
GGCGACAAGT TCGCCGAATA CTTCGACGCC AATACCTATC TCTTGATCAC GCGCGCGCTC 
GACTACTTCG ACCCGGCCGG TGAATTCGGC GGCGACCTGA GCCGCGCGCT GGCCCAGGCC 
AGCGCCAAGT TCTTGCTGGT CAGCTTCACC ACCGACTGGC GGTTTTCCCC GGCGCGCAGC 
CGCGAAATCG TCAAGGCCCT GCTCGACAAC CAGATTGATG TGAGCTACGC CGAAATCGAC 
GCGCCCCATG GCCATGATGC ATTTTTGCTC GATGATGCAC GCTACATGGG CGTGGTGCGC 
TCCTATTTCG AGAGCAAGGT GAGCGCATGA

Protein sequence

MHFADVLPLR SGASIRAYDL SYETYGQLNA DKSNAVLICH ALNASHHVAG VYLDESGQIQ 
KKSEGWWDTM IGPGKPVDTN RFFVIGVNNL GSCFGSTGPM QTNPDTNEVY GADFPVVTVQ 
DWVDAQARLL DALGIQTLAA VMGGSLGGMQ ALSWTLQYPG RVRHAVVVAS APNLTAENIA 
FNEVARRAIV TDPDFHGGHF YKHGVLPKRG LRIARMIGHI TYLSDDVMNE KFGRQLRDAA 
GIKFSTQDVE FQIESYLRYQ GDKFAEYFDA NTYLLITRAL DYFDPAGEFG GDLSRALAQA 
SAKFLLVSFT TDWRFSPARS REIVKALLDN QIDVSYAEID APHGHDAFLL DDARYMGVVR 
SYFESKVSA