Gene Pmen_2012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pmen_2012
Symbol
ID	5109903
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas mendocina ymp
Kingdom	Bacteria
Replicon accession	NC_009439
Strand	-
Start bp	2222617
End bp	2223645
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	71%
IMG OID	640503253
Product	homoserine dehydrogenase
Protein accession	YP_001187505
Protein GI	146307040
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.148212
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.080267
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAACGC TCAAGGTGGC CATCGCCGGC TTCGGCGGCG TCGGTCGCGC CACGGCCGAG 
CTGCTGCTGC AGCGCCGCGA CCGCTATCGC CAGGTCTACG GCGTGGACGT GCGCCTGGTC 
GCGGTGTGTG GCTCGCGCGC CGGCCTGGCC GACGCCAACG GCCTGCAAGC CGGGCAGCTG 
GCCGCGCTGC AGCCCGGTCT GACGGGGCCC GCGTTCATCG CGGCGAGCGG CGCGTCGGTG 
CTCATCGAAG CCGGCCCCAG CGATTTTCGC AGCGGCGGGC CGGGCCTTGC CTACCTGCGC 
GAGGCGCTGG CGGCCGGGCA GGACTGCATC GTCATAAGCA AAGGCGCACT GGTGCACAGC 
GGCCCGCAGC TGCGCGAACT CGCGCGCACC TCGGGGGCCA TGCTGAAACT CAGCGGCGCC 
GCGGCGGCGG CCCTGCCCAC GCTGGATCTG CTCCAGCACA GCCTGGCCGG CTGCCAGGTG 
CTCGCCGTCG AGGGCATCCT CAACGCCACC ACCAACTACC TGCTCGATGC CATGCGCACC 
CAGGGGCTCG GCTTCGACGC GGCGCTGCAT GAGGCGCAGG CCGGCGGCTT CGCCGAAGCG 
GACACGCGCA ACGACACCGA AGGCTGGGAT ACCGCCTGCA AACTCCTGCT GCTGGCCAAC 
TTCGGCCTGG GCGCCGATCT GACCATGGAA GATGTCGACG TCGAGGGCAT CCACGCGGTG 
ACGGCGCAGC GTATCGACAG CTGGGCGAAG CAGGGGCTGG TGCCCAGGCT GGTCGGCCGT 
CTCGAGCGGG TGAACGGCAC GCTGCGCGCC AGCGTCGGCA TCAAGACCTA CCCGCTGTCC 
GACCCTTTCG CTCAGGTCAA TGGCAAGAAC AAGGCGATCC GCATCAGCAG CGATGCCATG 
GGCGAAACCC TCGCCATCGG CTGCGGCGTC GAACCGCTCG CCACCGCGGC GGCCGCGCTC 
AAGGACCTCG AACATATTCT CCAGGCCAGG GCCGCGCGCC CGGCCCTCTC TACGGACCAC 
CCAGCATGA

Protein sequence

MQTLKVAIAG FGGVGRATAE LLLQRRDRYR QVYGVDVRLV AVCGSRAGLA DANGLQAGQL 
AALQPGLTGP AFIAASGASV LIEAGPSDFR SGGPGLAYLR EALAAGQDCI VISKGALVHS 
GPQLRELART SGAMLKLSGA AAAALPTLDL LQHSLAGCQV LAVEGILNAT TNYLLDAMRT 
QGLGFDAALH EAQAGGFAEA DTRNDTEGWD TACKLLLLAN FGLGADLTME DVDVEGIHAV 
TAQRIDSWAK QGLVPRLVGR LERVNGTLRA SVGIKTYPLS DPFAQVNGKN KAIRISSDAM 
GETLAIGCGV EPLATAAAAL KDLEHILQAR AARPALSTDH PA