Gene Dtpsy_1988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_1988
Symbol
ID	7382107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	-
Start bp	2124109
End bp	2125146
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	70%
IMG OID	643655306
Product	aminodeoxychorismate lyase
Protein accession	YP_002553444
Protein GI	222111180
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCCCG GCTTCTTTCA TACAGGCTGC AGGGTTGTGC GTCGTTTCCT CGCATTGGTG 
TTGCTCATCG TGATCGCCGT GGGCGCTGTG GCCGCCTGGT GGCTGCAGGC GCCGTTGCCG 
GTGCGCGCGG ACGTGCCCGC CGGCCAGCCG CTGGAGCTGG AGATCGAGCC TGGCACCACG 
CCACGCAGCG TGGCCCGCGC GGTGGTGCGG TCGGGCATGG CCACGGATGC AGACGTGCTG 
TTCCTGTGGT TCCGGCTGTC GGGCAAGGAC CGCGAGATCA AGGCCGGCAA CTACGAGATT 
CCCCAGGGCA CCAGCCCCTA CGCGCTGCTG CAGAAGCTGG TGCGCGGCGA GGAGGCATTG 
CGCGCCGTCA CGCTGGTGGA AGGCTGGACC TTTCGCCAGG TGCGCCAGGC GCTGGCGCGG 
GCCGAGCAGC TCAAGCCCGA CAGCCAGGGC CTGAGCGACG CGGACATCAT GGAGCGCCTG 
GGCCGCGCGG GCGTGCCCGC GGAGGGGCGC TTCTTTCCCG ACACCTACAC CTATGCCAAG 
GGCAGCAGCG ACATTGCCGT GCTGCGTCGC GCGCTGCACG CCATGGACCG GCGTCTGGAC 
GCGGCCTGGG CGCAGCGCGC GCCGGACACG CCGCTCCAAT CCGCCGACCA GGCGCTGATC 
CTGGCGAGCA TCGTCGAGAA GGAAACCGGC CGCGCCGAAG ACCGCGCGCA GATCGCCGGC 
GTGTTCAGCA ACCGCCTGCG CGTGGGCATG CTGCTGCAGA CCGACCCCAC GGTGATCTAC 
GGCCTGGGTG AGAAGTTCGA CGGCAACCTG CGCCGCCGTG ACCTGACCGC CGACACCCCC 
TACAACACCT ACACACGTGT GGGCCTGCCG CCCACGCCGA TTGCCATGCC CGGCAAGGCG 
GCGCTGTTGG CCGCGGTGCA GCCCGCGCCC ACCAAGGCGT TGTACTTCGT GGCGCGCGGC 
GACGGTTCCA GCCACTTCAG CAGCACGCTC CAAGACCACA ACCGTGCGGT GAACCGCTAC 
CAACGCGGCC AGAAATGA

Protein sequence

MMPGFFHTGC RVVRRFLALV LLIVIAVGAV AAWWLQAPLP VRADVPAGQP LELEIEPGTT 
PRSVARAVVR SGMATDADVL FLWFRLSGKD REIKAGNYEI PQGTSPYALL QKLVRGEEAL 
RAVTLVEGWT FRQVRQALAR AEQLKPDSQG LSDADIMERL GRAGVPAEGR FFPDTYTYAK 
GSSDIAVLRR ALHAMDRRLD AAWAQRAPDT PLQSADQALI LASIVEKETG RAEDRAQIAG 
VFSNRLRVGM LLQTDPTVIY GLGEKFDGNL RRRDLTADTP YNTYTRVGLP PTPIAMPGKA 
ALLAAVQPAP TKALYFVARG DGSSHFSSTL QDHNRAVNRY QRGQK