Gene Saro_1326 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1326
Symbol
ID	3917775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1369010
End bp	1370335
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	70%
IMG OID	640444063
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_496604
Protein GI	87199347
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCCTC GCCGCTTCAC CGCCAATGGC CCGCTCAAGG GCCGCATCGG CGTGCCCGGC 
GACAAGTCGA TCAGCCACCG CTCGATCATG CTCGGCGCGC TGGCAGTGGG CGAGACGCGC 
GTGACCGGCC TGCTCGAAGG CGAGGACGTC CTTTCCACCG CCGCCGCGAT GCGCGCGATG 
GGCGCGACGA TCGAACGCGA CGCGGACGGC ATGTGGCACG TTCACGGCGT TGGCGTGGGC 
GGCCTGCTCC AGCCGCAACA GGCGCTGGAC ATGGGCAATT CGGGCACGTC GACCCGCCTG 
CTGATGGGCC TTGTCGCAAC CCACCCGATC ACGGCGACGT TCGTGGGCGA TGCTTCGCTG 
TCGAAGCGCC CGATGGGCCG CGTGATCGAT CCGCTCTCGA CGATGGGCGC CGAGTTCACC 
GCATCGCCGG GTGGCCGCCT GCCCCTTACC CTGCGCGGAA TTTCACCTGC CGTGCCAATC 
GAATACCGCC TCCCCGTCGC ATCGGCGCAG GTGAAGAGCG CGGTCCTGCT CGCGGGCCTC 
AACACGCCCG GCGTGACCAC GGTAATCGAA CCGATCCCCA CCCGCGACCA TTCCGAACGC 
ATGCTGCGCG GCTTCGGCGC GGAGCTGACC GTCGATGTCG CCGCCGATGG CGCGCGCGTC 
ATCAGGGTGC GCGGCGAGGC CGAACTCAAG CCGCAGGACA TCGCCGTCCC CGGCGACCCG 
TCATCCGCCG CGTTCTTCGT GGTGGCGGCG CTGCTGGTCG AAGGCTCGGA CCTCGTCGTC 
GAGAACGTCG GCCTCAACCC CACCCGCGCC GCGCTGTTCG ACGTGCTGCG CCTGATGGGC 
GGCTCCATCG AGGAGCTGAA CCGGCGCGAA GTGGGCGGCG AACCGGTGGC GGACCTGCGC 
GTGCGCCACT CGCTGCTGAC CGGCATCGAT GTCGATCCCG CCGTAGTGCC GAGCATGGTC 
GACGAATTCC CGGTGCTGTT CGTCGCCGCC GCCCTTGCCA AGGGCCGCAC GGTGACGACC 
GGCCTCGAGG AACTGCGCGT GAAGGAAAGC GACCGCATCA GCGCGATGCG CGCCGCGCTC 
GAACTGGCAG GCGCGACCGT CACCGAGACC GAGGACGGCC TGATCATCGA CGGCACCGGC 
GGCGACCCCC TGCCCGGCAC CGCAGAGGGC GCGAGCGTCG TCACGCACCT CGACCACCGC 
ATCGCGATGA GCATGGCGAT TGCCGGCATC GCCAGCCGCA ACGGCGTGGA AGTGGATGAC 
ACCCGCCCCA TCGCCACCAG CTTCCCGGTG TTCGAGAGCC TGCTGGAAAG CGCGACCAGG 
CCGTGA

Protein sequence

MRPRRFTANG PLKGRIGVPG DKSISHRSIM LGALAVGETR VTGLLEGEDV LSTAAAMRAM 
GATIERDADG MWHVHGVGVG GLLQPQQALD MGNSGTSTRL LMGLVATHPI TATFVGDASL 
SKRPMGRVID PLSTMGAEFT ASPGGRLPLT LRGISPAVPI EYRLPVASAQ VKSAVLLAGL 
NTPGVTTVIE PIPTRDHSER MLRGFGAELT VDVAADGARV IRVRGEAELK PQDIAVPGDP 
SSAAFFVVAA LLVEGSDLVV ENVGLNPTRA ALFDVLRLMG GSIEELNRRE VGGEPVADLR 
VRHSLLTGID VDPAVVPSMV DEFPVLFVAA ALAKGRTVTT GLEELRVKES DRISAMRAAL 
ELAGATVTET EDGLIIDGTG GDPLPGTAEG ASVVTHLDHR IAMSMAIAGI ASRNGVEVDD 
TRPIATSFPV FESLLESATR P