Gene Sama_2159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_2159
Symbol
ID	4604409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	-
Start bp	2608704
End bp	2609801
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	57%
IMG OID	639781544
Product	chorismate synthase
Protein accession	YP_928034
Protein GI	119775294
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGGGA ACAGCATAGG TCAGAATTTC GTGGTTACTA CCTTTGGCGA GAGCCATGGG 
GTGGCGCTCG GTTGCATTAT CGATGGTTGC CCTCCGGGCC TCGAGCTTAC CGAAGCTGAT 
ATGCAGCACG ATCTTGACCG TCGCCGTCCG GGCACGTCCC GCTACACCAC GGCGCGCCGC 
GAGCCGGACG AAGTGCGTAT TCTCTCAGGT GTTTTCGAAG GCAAAACAAC AGGAACCTCC 
ATTGGTCTGA TTATCGAAAA CACCGATCAG CGCAGCCAGG ACTACAGCAA TATCAAAGAC 
CTGTTCCGCC CCGGTCACGC CGATTACACC TATCAACAAA AGTACGGTCT GCGGGATTAT 
CGCGGCGGTG GCCGTTCGTC CGCCCGAGAA ACCGCCATGC GGGTTGCCGC CGGCGCTGTG 
GCGAAAAAGT ACCTCAAGGC CGTTCACGGG ATCGAAATTT ACGGCTTCCT GTCGCAACTT 
GGCCCCATTG AGGCAGAGCA CATCGACCGC GAGCAGATTG AGCAAAACGC CTTTTTCTTC 
CCTGATGCCA GCAAGCTTGA AGCGCTGGAT GAATATATGC GCGAGCTGAA AAAATCCGGC 
GACTCCATCG GTGCCAAGGT CAGCGTGATT GCCACCAATG TACCAGTGGG CCTGGGCGAG 
CCTGTGTTTG ACCGTCTTGA TGCCGACATC GCCCATGCGC TGATGGGCAT CAATGCCGTG 
AAGGGAGTGG AAATTGGCGA TGGTTTCGCG GTAGTGACCC AAAAGGGCTC CGAGCATCGT 
GATTTGATGT CACCCGAGGG CTTTGCCAGC AACCATGCCG GCGGCGTGCT TGGCGGCATT 
TCATCCGGTC AGCCAATTGT GGCCCATATG GCGCTTAAGC CAACCTCCAG TATCAGCATT 
CCCGGCGAGA GCATGACAGT GCAGGGCAAT ACTGCGGAAG TGGTTACCAA GGGCCGTCAC 
GACCCCTGCG TGGGCATTCG CGCCGTGCCT ATTGCCGAGG CCATGTTGGC GATTGTATTG 
ATGGATCATC TGCTCAGACA CCGTGCTCAG AATCAGCACG TGCACAGCGA AACCCCTGTG 
CTGGGGATGC GCTCTTAA

Protein sequence

MSGNSIGQNF VVTTFGESHG VALGCIIDGC PPGLELTEAD MQHDLDRRRP GTSRYTTARR 
EPDEVRILSG VFEGKTTGTS IGLIIENTDQ RSQDYSNIKD LFRPGHADYT YQQKYGLRDY 
RGGGRSSARE TAMRVAAGAV AKKYLKAVHG IEIYGFLSQL GPIEAEHIDR EQIEQNAFFF 
PDASKLEALD EYMRELKKSG DSIGAKVSVI ATNVPVGLGE PVFDRLDADI AHALMGINAV 
KGVEIGDGFA VVTQKGSEHR DLMSPEGFAS NHAGGVLGGI SSGQPIVAHM ALKPTSSISI 
PGESMTVQGN TAEVVTKGRH DPCVGIRAVP IAEAMLAIVL MDHLLRHRAQ NQHVHSETPV 
LGMRS