Gene Shew_1952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shew_1952
Symbol
ID	4920985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella loihica PV-4
Kingdom	Bacteria
Replicon accession	NC_009092
Strand	+
Start bp	2257349
End bp	2258629
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	54%
IMG OID	640163521
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_001094077
Protein GI	127512880
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000690945
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000426447
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACAAC TACGACTCAA TCCCATATCT AAGGTTCATG GTACCGTGAA TATTCCCGGT 
TCTAAGAGTA TCTCTAACCG CGCTCTGTTA TTGGCGACCT TAGCTGAAGG GAAAACCCGA 
CTGACCAATC TGCTCGATTC TGACGACATT CGTCACATGC TTACTGCCCT CAAGCAGCTC 
GGGGTTAATT ATCAATTATC TGACAATAAC CGGGTTTGCG AAGTCGAGGG GCTGAGCGGC 
GTGATTAATA GCGACACAGC CCAGACACTG TTTCTGGGTA ATGCCGGTAC GGCGATGCGC 
CCCTTATGTG CTGCGCTGAC CTTAGGCAGC GGCGAATTTA CCTTAACGGG CGAGCCGCGA 
ATGGAGGAGC GTCCCATAGG TGATCTGGTC GATGCCCTTA ACGCACTTGG CGCCGATATA 
CGCTACCTGA AACAGCCTGG CTTTCCGCCA CTGACCATTA ATGCCACCGG ACTCAATGGC 
GGCGATGTTG AGATCGCAGG CGACCTTTCC AGCCAGTTTT TAACCGCGCT GCTGATGGTA 
ACGCCGCTTG CCAAGGCCCA GGTGAATATC AAGATTAAAG GCGAGCTGGT CTCCAAACCT 
TATATCGACA TCACTATCGC GTTGATGGCG CAGTTTGGCG TGACCGTTAT CAATCACGAC 
TATCAGCGCT TTGAGATCCC TGCAGGCCAG AAATATGTCT CCCCCGGCAC TGTGCTGGTT 
GAAGGCGACG CCTCATCGGC CTCATACTTC CTGGCGGCGG GAGCCATTCA GGGCGGTGAG 
GTTAAGGTCA CCGGCGTTGG ACTGAAAAGT ATTCAAGGGG ATGTTAAGTT TGCCGAGGTG 
CTCGAAGCCA TGGGCGCACA GATAGAGTGG GGCGACGATT TTATCATCGC CAGAAGTGCG 
CCGCTGCATG GGGTGGATCT CGACATGAAC CACATCCCGG ATGCTGCCAT GACCATAGCG 
ACAGCGGCGC TGTTTGCCAC AGGCACCACG ACGCTGCGTA ATATCTATAA CTGGCGCATC 
AAGGAGACGG ACCGTCTCGC TGCCATGGCC ACCGAACTGC GTAAAGTCGG CGCCGAGGTA 
GAAGAGGGCC ATGATTATAT TCGCGTCACG GCGCCGGCTC AGTTAAATAC GGCCGATATC 
GATACTTATA ACGATCATCG CATGGCCATG TGTTTCTCGC TGATGGCCTT TGCCGATTGT 
GGCATTACCA TCAACGATCC TGATTGTACT TCCAAAACCT TCCCCGACTA CTTCGCCCAG 
TTTGCGGCGC TTGCCCAGTA G

Protein sequence

MKQLRLNPIS KVHGTVNIPG SKSISNRALL LATLAEGKTR LTNLLDSDDI RHMLTALKQL 
GVNYQLSDNN RVCEVEGLSG VINSDTAQTL FLGNAGTAMR PLCAALTLGS GEFTLTGEPR 
MEERPIGDLV DALNALGADI RYLKQPGFPP LTINATGLNG GDVEIAGDLS SQFLTALLMV 
TPLAKAQVNI KIKGELVSKP YIDITIALMA QFGVTVINHD YQRFEIPAGQ KYVSPGTVLV 
EGDASSASYF LAAGAIQGGE VKVTGVGLKS IQGDVKFAEV LEAMGAQIEW GDDFIIARSA 
PLHGVDLDMN HIPDAAMTIA TAALFATGTT TLRNIYNWRI KETDRLAAMA TELRKVGAEV 
EEGHDYIRVT APAQLNTADI DTYNDHRMAM CFSLMAFADC GITINDPDCT SKTFPDYFAQ 
FAALAQ