Gene Sala_1493 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1493
Symbol
ID	4081170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1555610
End bp	1556950
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	68%
IMG OID	638009859
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_616539
Protein GI	103486978
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.42537
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACC AAACCGCCAC ACCGCGCAGC TTTTCTGCCT CCGTTCCGTT GAAGGGCAGG 
ATCGCCATTC CGGGCGACAA GAGCATCTCG CACCGATCGC TGATGCTGTC GGCGCTGGCC 
GTCGGCGAAA GCCGCGTCGC CGGCCTGCTC GAAGGGCATG ATGTCCTCGC GACCGCCGCC 
GCGATGCGCG CCATGGGGGC CGATATCGCG CGCCGCGACG ACGGCGAATG GCGCATCCAC 
GGCGTCGGCG TCGGCGGCTT GCTCCAGCCG CGGGGCGCGC TCGACATGGG GAACAGCGGC 
ACGTCGACAC GTCTGCTGAT GGGGCTCGTC GCGAGCCACC CGATCACCGC CACTTTCGTC 
GGCGACGCCA GCCTGTCGGG TCGCCCGATG GGGCGCGTCA TCGATCCGCT GACCCAGATG 
GGCGCCGACA TCAGCGCCTC GCCGGGCGCC AGGGGGGCAA AAACTCTGCC GCTGATGGTC 
CGCGGCCTCG CGCCCGCCAT TCCCCTCTCC TACCGCCTGC CGATGGCGTC GGCGCAGGTG 
AAGAGCGCGA TCCTTCTCGC CGGACTCAAT ACGCCCGGCG TCACCGAAGT CATCGAGCCG 
GTGCCCACGC GCGACCACAG CGAGCGGATG CTCGGCGCCT TTGGCGCCGA TCTGACCGTC 
GACATCGACG CGGGCGGCAC GCGCCATATC CGTATCCGCG GCGAAGCCGA TCTCAAGCCG 
CAGGCGATCA TCGTCCCCGG TGATCCCTCC TCGGCCGCCT TCTTTATCGT TGCGGCGCTC 
ATCGTGCCCG GTTCGGACGT CACCATCGCC AACGTCGGTC TCAATCCGAC GCGCGCCGGG 
CTGGTCGAGG TTCTGAAGGC GATGGGCGGC GACATCGAAC TGCTCGACCG GCGCGAAATC 
GGCGGCGAAC CCGTCGCCGA CCTGCGCGTG CGCCACAGCG TGCTCAAAGG CATCGAGGTC 
GACCCGGCGG TTGCGCCGAG CATGATCGAT GAGTTTCCAG TCCTCTTCGT TGCCGCGACG 
CTCGCCGAAG GCCGCACGGT GACCACGGGG CTCGATGAAC TGCGCGTCAA GGAAAGCGAC 
CGCCTTGCCG TCATGGCGAC CGGGCTCAAG GCCATCGGCG CGCGTGTCGA GGAAAGCCAA 
GACGGCCTTG TCATTGATGG CACCGGCGGC GATCCGCTAG CCGGCGGCGC GACCATCGCC 
GGCCATCTCG ATCATCGCAT CTGCATGAGC TTCGCAATCG CGGGGCTTGT CAGCAAGGCG 
CCGGTGACGG TCGACGACAT CGCCCCCGTC GCAACGAGCT TCCCCAATTT CGAGGCATTG 
CTTGCGGGTT TGCAACAATG A

Protein sequence

MTDQTATPRS FSASVPLKGR IAIPGDKSIS HRSLMLSALA VGESRVAGLL EGHDVLATAA 
AMRAMGADIA RRDDGEWRIH GVGVGGLLQP RGALDMGNSG TSTRLLMGLV ASHPITATFV 
GDASLSGRPM GRVIDPLTQM GADISASPGA RGAKTLPLMV RGLAPAIPLS YRLPMASAQV 
KSAILLAGLN TPGVTEVIEP VPTRDHSERM LGAFGADLTV DIDAGGTRHI RIRGEADLKP 
QAIIVPGDPS SAAFFIVAAL IVPGSDVTIA NVGLNPTRAG LVEVLKAMGG DIELLDRREI 
GGEPVADLRV RHSVLKGIEV DPAVAPSMID EFPVLFVAAT LAEGRTVTTG LDELRVKESD 
RLAVMATGLK AIGARVEESQ DGLVIDGTGG DPLAGGATIA GHLDHRICMS FAIAGLVSKA 
PVTVDDIAPV ATSFPNFEAL LAGLQQ