Gene Sare_3212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3212
Symbol
ID	5705543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3702210
End bp	3703454
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	69%
IMG OID	641272643
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_001538010
Protein GI	159038757
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCAG CACAGGCCCG TGTCCCCGGG TCGAAGTCGT TGACCAACCG CGCCCTCGCC 
ATAGCGGCTA TGGCGGACGG AGTGACCGAG CTCGACAACC CGCTGGTGAG CGATGACACC 
TCGGCGTTCG CCGACGCGCT CGTCGCCCTC GGGGTGCCGG TCGAGCGGCA GGCCCGGCGG 
TGGACGGTGA CTGGCAGCAG GTCGGGGCCG CGGGTGAGGT CCGGTCGTGT CTGGTGCGAG 
GACGCCGGTA CGGCAGCCCG GTTCCTACCG CCCATGGTCG CGGCAGCCGG TGGTGTCTTC 
GACTTCGATG GCACGGACCA ACTACGTGCC CGGCCACTTC ACCCGCTGAT CGACGCGTTG 
CGGGCACTCG GCGCCACGGT CGAGCCCAGC GGTGACGGCG GCGGGCTGCC GTTTCGCCTG 
GTTTCGGATG GCCTGACCGG CGGGGAGGTC ACCCTTGCCA GCGGCACCAG CAGCCAGTAC 
CTGAGCGGGC TACTCATGGC CGGGCCGTTG CTGTCCAACC CGCTCACGGT GGTCGCGCCG 
GAACTGGTCA GCCGGCCGTA CGTCGACATG ACGATCGCCG TGATGGCCCG CTTCGGGGTC 
CAGGTCACCG AGGCCAGGCC TGACCGCTTC ACCGTTCACC CTGGCCGGTA TACCCGCGCT 
CGGTACCTCG TGGAGCCCGA TGCCTCCACC GCTTCGTATG TTCTCGCGGC CGCCGCTGTC 
ACCGGCAAGG AAGTGTCCGT GGACGGCTTG GGCAGTGCCA GCCCGCAGGG CGACCGGCGG 
TTCGTCGATG TGCTGTCCCA GCTGGGCGCC ACGGTGACGG CGGACCGCGA TCGGGTGACC 
GTGCGAGGGC CGCGACACCT TCGTGGGGGA TTCGAGGTCG ACATGGGGTC GATCTCGGAC 
ACCTTTATGA CCCTTGCCGC CATTGCGCCA CTCGCTGACG CGCCGATCCG AATCACCGGT 
GTGGGTCACG CCCGACTCAA GGAGTCCGAC CGGATCGACG CGATGGCGCA GAACCTTGTC 
GCGTGTGGCG TTCCGGTGCG GACAGGACCG GACTGGATCG AGATCTCCCC GACGGACCCG 
TCCCCGGCCC CCATCCACTG TCGGCGAGAC CATCGCATCG CGATGTCATT CTCGGTGCTC 
GGACTGCGGG TTTCCGGTCT GCTCCTCGAT GACCCGGCAT GCGTGTCGAA GACCTTTCCC 
GGGTTCCACG ACGAGTTGGC CAGACTGTTC GCCGACGGCC GGTGA

Protein sequence

MSAAQARVPG SKSLTNRALA IAAMADGVTE LDNPLVSDDT SAFADALVAL GVPVERQARR 
WTVTGSRSGP RVRSGRVWCE DAGTAARFLP PMVAAAGGVF DFDGTDQLRA RPLHPLIDAL 
RALGATVEPS GDGGGLPFRL VSDGLTGGEV TLASGTSSQY LSGLLMAGPL LSNPLTVVAP 
ELVSRPYVDM TIAVMARFGV QVTEARPDRF TVHPGRYTRA RYLVEPDAST ASYVLAAAAV 
TGKEVSVDGL GSASPQGDRR FVDVLSQLGA TVTADRDRVT VRGPRHLRGG FEVDMGSISD 
TFMTLAAIAP LADAPIRITG VGHARLKESD RIDAMAQNLV ACGVPVRTGP DWIEISPTDP 
SPAPIHCRRD HRIAMSFSVL GLRVSGLLLD DPACVSKTFP GFHDELARLF ADGR