Gene YPK_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YPK_2044
Symbol	trpD
ID	6087756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis YPIII
Kingdom	Bacteria
Replicon accession	NC_010465
Strand	+
Start bp	2275498
End bp	2276496
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	53%
IMG OID	641597111
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001720784
Protein GI	170024279
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACATT TATTCGAAAA ACTGTTCCGG GCTGAGTCAA TGAGCCAAGA AGAAAGCCAG 
CAACTGTTTG CGGCGATTGT ACGTGGTGAA CTCGATCCAA GCCAACTGGC CGCAGTGCTA 
ATCAGCATGA AAGTACGCGG GGAGACCCCA GCGGAGATTG CCGGGGCAGC TCAAGCTTTA 
CTGGCAGATG CGCAACACTT TCCACGCCCA GACTACCTGT TTGCCGATAT TGTCGGGACC 
GGCGGTGATG GCACCAACAG TATTAATATC TCCACCGCCA GTGCCTTTGT CGCGGCTAGC 
TGTGGCGTAA AAGTGGCTAA ACATGGTAAC CGCAGTGTTT CTAGCCGTTC CGGTTCATCC 
GATCTGCTGG CGGCATTTGG TATCCGTTTG GACATGAGTG CCGAGCAATC ACGGTTGGCG 
TTGGACGATC TCGGGGTCTG CTTCCTGTTT GCGCCGCAAT ATCACACGGG TTTTCGTCAT 
GCGATGCCAG TACGCCAACA GTTAAAGACC CGCACCCTGT TTAATGTGTT GGGGCCGTTG 
ATCAACCCCG CCCGCCCGCC GCTGGCGCTC ATTGGCGTCT ATAGCCCTGA GTTAGTGTTA 
CCGATCGCTC AAACGCTGAA AGTGCTGGGT TATCAACGCG CGGCAGTGGT ACATGGCGGT 
GGAATGGATG AAGTGGCTAT TCATGCCCCG ACGCAGGTGG CTGAACTGAA TAACGGCAGT 
ATTGAAAGCT ATCAATTGAC GCCAGAAGAT TTTGGTTTGA ATCGCTACCC GCTTGCCGCT 
CTACAAGGCG GTATGCCGGA AGAAAACCGT GACATTTTAG CACGGTTGTT ACAAGGTAAA 
GGTGAAACAG CACATGCGGC CGCCGTTGCT GCAAACGTCG CCTTGCTGCT GAAGTTATAC 
GGCCAAGAAA ACCTGCGCCA TAATGCGCAA CAGGCATTGG AAATGATTCA CAGCGGTCAG 
GCTTTTGATC GTGTTACTGC TCTGGCAGCG AGAGGATAA

Protein sequence

MQHLFEKLFR AESMSQEESQ QLFAAIVRGE LDPSQLAAVL ISMKVRGETP AEIAGAAQAL 
LADAQHFPRP DYLFADIVGT GGDGTNSINI STASAFVAAS CGVKVAKHGN RSVSSRSGSS 
DLLAAFGIRL DMSAEQSRLA LDDLGVCFLF APQYHTGFRH AMPVRQQLKT RTLFNVLGPL 
INPARPPLAL IGVYSPELVL PIAQTLKVLG YQRAAVVHGG GMDEVAIHAP TQVAELNNGS 
IESYQLTPED FGLNRYPLAA LQGGMPEENR DILARLLQGK GETAHAAAVA ANVALLLKLY 
GQENLRHNAQ QALEMIHSGQ AFDRVTALAA RG