Gene Strop_2986 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2986
Symbol
ID	5059450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	3415749
End bp	3416993
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	68%
IMG OID	640475237
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_001159802
Protein GI	145595505
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.710581
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.414192
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCAA TACGGGCCCG CGTGCCCGGA TCGAAGTCCT TGACCAACCG TGCCCTCGCC 
ATCGCGGCTA TGGCGGACGG AGTGACCGAA CTCGACAATC CGCTGGTGAG CGATGGCACC 
ACGGCGTTCG CCGACGCGCT CGTCGCCCTC GGGGCGTCGG TCGAACGGCA CGCCCAGCGG 
TGGACGGTGA CTGGCAGCGG CGCCGGGACG CGGTTGAGGT CCGGTCGAGT CTGGTGCGAG 
GACGCCGGTA CGGCAGCCCG GTTCCTACCG CCCATGGCCG CGGCAGCCGG TGGTGTCTTC 
GACTTCGATG GCACGGACCA ACTACGTGCC CGGCCACTTC ATCCGCTGAT CGACGCACTG 
CGTGCACTTG GCGCGACGGT CGAGCCCAGC GGTGACGGCG AGGGACTGCC GTTCCGTCTG 
GTATCGGATG GCCTTACCGG GGGTGAAGTC GTGCTCGCCA GCGGCACCAG CAGCCAGTAC 
CTGAGCGGGC TACTCATGGC CGGGCCGTTG CTGTCCAACC CGCTTACGGT GGTCGCGCCG 
GAACTGGTCA GCCGGCCGTA CGTCGATATG ACGATCGCCG TGATGGCTCG CTTCGGGGCT 
CAGGTCGCTG AGGCCATCCC TGGCCGCTTC ACCGTTCGCC CCGGTCGGTA CACCCGCACC 
CAGTTTCTCG TCGAGCCGGA CGCCTCGACC GCTTCGTATG TTCTCGCGGC CGCCGCAGTC 
ACGGGGAAGG AGGTATCCGT AGATGGGTTG GGCAGCGCCA GCCTGCAGGG CGACCGGCGG 
TTCGTCGACG TGCTGTCTCA ACTGGGCGCC AAGGTGACGG CGGACCGAGA TCGGGTGACG 
GTGCGAGGGC CGCGACAGTT GCGTGGGGGA TTCGCGGTCG ACATGGGGCC GATCTCCGAC 
ACCTTTATGA CCCTCGCCGC CATCGCGCCG CTCGCTGACG CGCCGATTCG AATCACCGGC 
GTGGGCCACG CCCGCCTCAA GGAGTCAGAC CGGATCGACG CGATAGCACA GAACCTTGTC 
TCGTGTGGCG TTCCGGTGCG GACAGGAGCG GACTGGATCG AGATTTCCCC GGCGGACCCA 
TCCGCGGCCC TGATCCGCTG TCGGCGGGAC CACCGCATCG CGATGTCGTT CTCGGTGCTC 
GGGCTGCGGG TTCCCGGTCT GGTCCTCGAT GACCCGGCAT GCGTGTCGAA GACCTTTCCC 
GGATTCCACG ACGAGTTGGC AAGACTGTTC GCCGGCGACC GCTGA

Protein sequence

MSAIRARVPG SKSLTNRALA IAAMADGVTE LDNPLVSDGT TAFADALVAL GASVERHAQR 
WTVTGSGAGT RLRSGRVWCE DAGTAARFLP PMAAAAGGVF DFDGTDQLRA RPLHPLIDAL 
RALGATVEPS GDGEGLPFRL VSDGLTGGEV VLASGTSSQY LSGLLMAGPL LSNPLTVVAP 
ELVSRPYVDM TIAVMARFGA QVAEAIPGRF TVRPGRYTRT QFLVEPDAST ASYVLAAAAV 
TGKEVSVDGL GSASLQGDRR FVDVLSQLGA KVTADRDRVT VRGPRQLRGG FAVDMGPISD 
TFMTLAAIAP LADAPIRITG VGHARLKESD RIDAIAQNLV SCGVPVRTGA DWIEISPADP 
SAALIRCRRD HRIAMSFSVL GLRVPGLVLD DPACVSKTFP GFHDELARLF AGDR