Gene Daci_4721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daci_4721
Symbol
ID	5750313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Delftia acidovorans SPH-1
Kingdom	Bacteria
Replicon accession	NC_010002
Strand	+
Start bp	5174028
End bp	5175128
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	68%
IMG OID	641299826
Product	chorismate mutase
Protein accession	YP_001565735
Protein GI	160900153
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01807] chorismate mutase domain of proteobacterial P-protein, clade 2

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.997566
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA CACCCCAAGC CTCTCCCGAT CTGGCGCATC TGCGCGTGCA GATCGACGAT 
ATCGACCAGC AACTGCTGGA TCTGCTGAAC CGACGTGCCC GCGTGGCAGA GCAGGTCGGC 
GAGGTCAAGA AGCGTGAAGG CACGCCCTTC TTCCGCCCGG ACCGCGTGGC CCAGGTCATC 
CAGAAGATCG AGTCCGCCAA TCCCGGCCCG CTCAAGAATG GCCATGTCTC GGCCATCTGG 
CGCGAGATCA TGTCGGCCTG CCTGGCGCTG GAGTCGCCCC AGCGCGTGGC CGTGCTGGGC 
CCGGCGGGCA CGTTCTGCGA GGAAGCCGCC ATCCAGTACT TCGGCGGCGC GGCCGATCTG 
ATGTACTGCA ACAGCTTCGA CGAGGTGTTC CACGCCACGG CCGCAGGCAG CGCGCAGTAC 
GGCGTGGTGG GCGTGGAGAA CTCCAACGAA GGCGTGGTCA CGCGCTCGCT GGACATGTTC 
CTGCACACGC CCTGCCACGT GGTGGGCGAG GTCAGCCTGC TGGTGCGCCA CAACCTGCTT 
CGCAGCAGCA ACACGACCGA GGGCATCGAG GTCGTGGCAG CCCATCCCCA GGCCCTGGCA 
CAGTGCCAGG GCTGGCTGGC CAAGCACCTG CCGCATGCCG AGCGCCGCCC GGTGTCCAGC 
AATGCCGAAG GCGCCCGCCT GGCGGCGCTG CACCCCAACA TCGCCGGCCT GGCCAGCGAA 
CGCGCGGCCC AGCAATTCGG CCTGCATGTG GTGGCGCATG CCATCCAGGA CGATGCCTAC 
AACCGCACGC GCTTCGCCGT CATCTGCCTG CCGCACACGC TGGCCACGCC CTCGCCCAGC 
GGCCAGGATT GCACCAGCAT CATCATCTCC GTGCCCAACC GCCCCGGTGC CGTGCATGAC 
CTGCTGGTGC CGCTGAAGAA GCACGGCGTG TCGATGACGC GCTTCGAGTC GCGCCCCGCG 
CGCACCGGCC AGTGGGAGTA CTACTTCTAC ATCGACCTCG AAGGCCACCC GGCACAGCCC 
AACGTGGCCA GCGCGCTGGA AGAGTTGCGC GGCCTGTGCG CCTTCTACAA GGTGCTGGGC 
ACCTACCCGG TATCCAAGTG A

Protein sequence

MSTTPQASPD LAHLRVQIDD IDQQLLDLLN RRARVAEQVG EVKKREGTPF FRPDRVAQVI 
QKIESANPGP LKNGHVSAIW REIMSACLAL ESPQRVAVLG PAGTFCEEAA IQYFGGAADL 
MYCNSFDEVF HATAAGSAQY GVVGVENSNE GVVTRSLDMF LHTPCHVVGE VSLLVRHNLL 
RSSNTTEGIE VVAAHPQALA QCQGWLAKHL PHAERRPVSS NAEGARLAAL HPNIAGLASE 
RAAQQFGLHV VAHAIQDDAY NRTRFAVICL PHTLATPSPS GQDCTSIIIS VPNRPGAVHD 
LLVPLKKHGV SMTRFESRPA RTGQWEYYFY IDLEGHPAQP NVASALEELR GLCAFYKVLG 
TYPVSK