Gene Sde_2147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_2147
Symbol
ID	3967531
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	2738462
End bp	2739583
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	47%
IMG OID	637921237
Product	prephenate dehydratase
Protein accession	YP_527619
Protein GI	90021792
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01807] chorismate mutase domain of proteobacterial P-protein, clade 2

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.707843
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGATA AATCCGAGCC AATTAGTGCA GAAGAAGCGG CGCTTCTTGG TGAATTGCGC 
GTAAAAATAG ACGATATAGA TCAGCAGATT GGCGACTTAA TATGTGCTCG CGCAAATTGT 
GCGGTAGAAG TTGCCCATGT AAAAAAACGC TTTTCTAATA TCACCGAGCC AAAGTTTTAT 
CGCCCAGAGC GCGAAGCACA GGTATTGCGC AATGCTATGG CGCGTAACAA GGGTCCGTTG 
TCTAACGAAG AGTTTGCCCG TTTATTTCGC GAAATAATGT CTGCTTGCTT GGCTTTAGAA 
GCACCAGTAA AAGTGGCTTA CTTGGGGCCA GAAGGCACCT ATACCCAGCA AGCCGCACTT 
AAGCATTTCG GTCATTCCGC TCAAGCTGTT TCTTTGCCCG CTATTGATGA AGTTTTCCGC 
GAAGTAGCAT CTGGTGCTGC GCACTATGGT GTAGTGCCGG TAGAAAACTC CACCGAAGGC 
GTGGTTACGC ACACCTTAGA TAACTTTTTA GGCAGTAGCG TAAAAATTTG TGGTGAAGTT 
GTACTGCGTA TTCATCACCA CCTGTTAGTT TCTGATGTAA CACACGTACA AAATATTTCG 
CGCATTTATT CTCATGCGCA GTCTTTGGCG CAATGCAGAA AATGGTTAGA TGCACATTAC 
CCTCGTGCAG AGCGTATAGC GGTAAGCAGT AATGCAGAAG CAGCACGCCG AATAAAAGGC 
GAGTGGAATT CAGCTGCCAT TGCAGGCGCT ATGGCGGCAG ATTTATACGG CCTTACTAGC 
CACGCACAAA ATATTGAAGA CCAGCCAGAT AACTCCACGC GCTTTTTAAT TATTGGTGCA 
GAAAGCGTAG GTGCAAGCGG CGAAGATAAA ACTTCTATTG TTGTGTCTAT GAAAAACGAG 
CCGGGTGCGT TGCACAATTT GCTAGAGCCA TTCCATCAGC ACGGCATAGA TTTAACCCGC 
GTAGAAACTC GTCCATCGCC AACCGGTGCG TGGAACTACG TGTTTTTTAT AGATTTTGCC 
GGCCATGCCA GCGAGCCAGT TGCTAAAAAA GTGCTAGAGG AAGTGGGGCG CAGAGCCTCA 
GATCTGAAAA TATTAGGCTC ATACCCTAAA GGCGTACTTT GA

Protein sequence

MSDKSEPISA EEAALLGELR VKIDDIDQQI GDLICARANC AVEVAHVKKR FSNITEPKFY 
RPEREAQVLR NAMARNKGPL SNEEFARLFR EIMSACLALE APVKVAYLGP EGTYTQQAAL 
KHFGHSAQAV SLPAIDEVFR EVASGAAHYG VVPVENSTEG VVTHTLDNFL GSSVKICGEV 
VLRIHHHLLV SDVTHVQNIS RIYSHAQSLA QCRKWLDAHY PRAERIAVSS NAEAARRIKG 
EWNSAAIAGA MAADLYGLTS HAQNIEDQPD NSTRFLIIGA ESVGASGEDK TSIVVSMKNE 
PGALHNLLEP FHQHGIDLTR VETRPSPTGA WNYVFFIDFA GHASEPVAKK VLEEVGRRAS 
DLKILGSYPK GVL