Gene Rsph17025_3880 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3880
Symbol
ID	5085428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009429
Strand	+
Start bp	779527
End bp	780864
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	72%
IMG OID	640485439
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_001170040
Protein GI	146279882
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGAC ACGGGGCCGC GCAACCGATG ACCGCCCGCC GCTCGGGGCC GCTCAGGGGG 
AGGGCCGAGA TCCCGGGCGA CAAGTCGATC AGCCACCGCG CGCTGATCCT GGGCGCGATG 
GCTGTTGGCG AGACGCGGAT CACGGGCCTG CTCGAGGGGC AGGACGTGCT CGATACGGCC 
AAGGCGATGC GCGCCTTCGG GGCCGAGCTG ATCCAGCACG GCCCGGGCGA CTGGTCGGTG 
CATGGGGTGG GAGTGGGCGG CTTTACCGAA CCCGCCGAGG TGATCGACTG CGGCAACTCG 
GGAACGGGGG TGCGGCTCAT CATGGGGTCG ATGGCGACGT CGCCGATCAC CGCCACCTTC 
ACGGGCGACG CCTCGTTGCG CAAGCGGCCG ATGGGGCGGG TGACCGATCC GCTGGCGCTG 
TTCGGGGCGC GCGCCTACGG GCGCAAGGGC GGGCGGTTGC CGATGACGCT GGTGGGGGCG 
GCCGAGCCGG TGCCGGTGCA CTACACGGTG CCGGTGCCGT CGGCGCAGGT GAAGTCGGCC 
GTCCTGCTCG CGGGGTTGAA CGCGCCGGGC CAGACGGTGG TCGTCGAACG CGAGGCCACG 
CGGGACCATT CCGAGCGGAT GCTGCGCGGC TTCGGGGCGG AACTGACGGT CGAGGCCGCG 
CCCGAAGGGC AGATCATCAC CCTGACGGGG CAGCCCGAGC TGCGGCCGCA GACGGTGGCG 
GTGCCGCGCG ATCCGTCCTC GGCGGCCTTT CCGGTCTGCG CCGCGCTGAT CGTGGAAGGG 
TCGGAGATCC TCGTGCCGGG GGTCAGCCGG AATCCGACGC GGGATGGCCT TTATGTGACG 
CTGCTCGAGA TGGGGGCGGA CATCGCCTTC GAGAACGAGC GCGAGGAAGG GGGCGAGCCG 
GTCGCGGACC TCCGCGTGCG CGCCTCGGAG CTGAAGGGGG TGGAGGTGCC GCCCGAGCGC 
GCGCCGTCGA TGATCGACGA ATATCCGATC CTGTCGGTGG TGGCGGCCTT CGCGGACGGC 
ACCACCATCA TGCGCGGTGT GAAGGAGTTG CGCGTGAAGG AGAGCGACCG GATCGACGCC 
ATGGCGCGCG GCCTCGAGGC CTGCGGCGTG CGGATCGAGG AGGACGAGGA CACGCTGGTC 
GTGCACGGGA GGGGGAGCGT TCCGGGAGGG GCGACCTGCG CCACCCACCT CGACCACCGC 
ATCGCGATGA GCTTCCTCGT GCTCGGCATG GCCGCGGAGG CGCCGGTCGC GGTGGACGAC 
GGCTCGCCCA TCGAGACCTC CTTTCCGATC TTCATGGGGT TGATGCGCAC GCTCGGGGCG 
GATCTGTCGG ACGGTTGA

Protein sequence

MSGHGAAQPM TARRSGPLRG RAEIPGDKSI SHRALILGAM AVGETRITGL LEGQDVLDTA 
KAMRAFGAEL IQHGPGDWSV HGVGVGGFTE PAEVIDCGNS GTGVRLIMGS MATSPITATF 
TGDASLRKRP MGRVTDPLAL FGARAYGRKG GRLPMTLVGA AEPVPVHYTV PVPSAQVKSA 
VLLAGLNAPG QTVVVEREAT RDHSERMLRG FGAELTVEAA PEGQIITLTG QPELRPQTVA 
VPRDPSSAAF PVCAALIVEG SEILVPGVSR NPTRDGLYVT LLEMGADIAF ENEREEGGEP 
VADLRVRASE LKGVEVPPER APSMIDEYPI LSVVAAFADG TTIMRGVKEL RVKESDRIDA 
MARGLEACGV RIEEDEDTLV VHGRGSVPGG ATCATHLDHR IAMSFLVLGM AAEAPVAVDD 
GSPIETSFPI FMGLMRTLGA DLSDG