Gene Dtpsy_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_2046
Symbol
ID	7385039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	-
Start bp	2190328
End bp	2191428
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	67%
IMG OID	643655365
Product	chorismate synthase
Protein accession	YP_002553502
Protein GI	222111238
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.226148
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGCA ACACACTCGG TACCCTTTTT TGCGTCACCA ACTTTGGTGA ATCCCATGGC 
CCCGCCATCG GCTGCGTGAT CGACGGCTGC CCGCCCGGCA TGGAACTGTC CGAGGCCGAC 
ATTCAGGCCG ACCTGGACCG CCGCCGCCCC GGCACCAGCC GCCATGTGAC GCAGCGCAAC 
GAGCCGGATG CGGTGGAAAT CCTCTCGGGC GTGTATGAGG GCAAGACCAC CGGCACGCCC 
ATCGCGCTGC TGATCCGCAA CACCGACCAG CGCAGCAAGG ACTACGGCAA CATCGCGCAG 
AGCTTCCGCC CGGGTCATGC CGACTATGCC TACTGGCACA AGTACGGCCT GCGCGACCCG 
CGCGGAGGCG GACGCTCGTC TGCGCGCCTC ACGGCACCCA CCGTGGCTGC CGGCGCGGTG 
GCCAAGAAAT GGCTGGCCGA GAAATACGGC ACCCGCTTTC GTGCCTGCAT GACCCAGCTG 
GGCGAACTGC CCATCCCGTT CGAGAATTGG GAGCATGTGC CGCACAACCC CTTCTTCGCA 
CCGGTGGCCG ACGTGCAGGC CTACGAGGAC TACATGGACG CGCTGCGCAA GTCCGGCGAC 
TCCTGCGGCG CGCGCATTCG TGTGCAGGCC ACCAGCGTGC CCGTGGGGCT GGGCGAGCCG 
CTGTACGACA AGCTGGACGC CGACATCGCC CATGTGATGA TGGGCCTGAA CGCGGTGAAG 
GGTGTGGAGA TTGGGGCCGG CTTTGCCAGC GTGGCCCAGC GCGGTACCAC GCATGGCGAT 
TCGCTCACGC CCACGGGCTT CGCCAGCAAC AACGCGGGTG GCGTGCTGGG CGGCATCAGC 
ACGGGGCAGG ACATCGAGGT TTCGCTGGCC ATCAAGCCCA CCAGTTCCAT CATCAGCCCG 
CGCGAGTCCA TCGACATCCA CGGCCAGAGT ACCGAGGTGA TCACGAAGGG GCGCCACGAC 
CCCTGCGTGG GCATCCGCGC CGCGCCGATC GCCGAGGCGT TGCTCGCATT GGTCATCATG 
GACCATGCGC TGCGCCACCG TGCGCAATGC GGCGACGTGG TGCAGGCCGT GGCTCCGATT 
CCGGCAGTCC GCCTGGGGTG A

Protein sequence

MSGNTLGTLF CVTNFGESHG PAIGCVIDGC PPGMELSEAD IQADLDRRRP GTSRHVTQRN 
EPDAVEILSG VYEGKTTGTP IALLIRNTDQ RSKDYGNIAQ SFRPGHADYA YWHKYGLRDP 
RGGGRSSARL TAPTVAAGAV AKKWLAEKYG TRFRACMTQL GELPIPFENW EHVPHNPFFA 
PVADVQAYED YMDALRKSGD SCGARIRVQA TSVPVGLGEP LYDKLDADIA HVMMGLNAVK 
GVEIGAGFAS VAQRGTTHGD SLTPTGFASN NAGGVLGGIS TGQDIEVSLA IKPTSSIISP 
RESIDIHGQS TEVITKGRHD PCVGIRAAPI AEALLALVIM DHALRHRAQC GDVVQAVAPI 
PAVRLG