Gene Bpro_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_1842
Symbol
ID	4015513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	+
Start bp	1903679
End bp	1904776
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	65%
IMG OID	637941511
Product	chorismate synthase
Protein accession	YP_548673
Protein GI	91787721
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.473892
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.107896
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGCA GTACCTTTGG CAATCTCTTC GCAGTCACCA ACTTTGGTGA ATCCCACGGC 
CCGGCCATTG GCTGCGTGAT TGACGGCTGC CCGCCGGGGC TGGCGCTGAC CGAAGCGGAT 
ATCCAGACCG ATCTGGACCG CCGCCGTCCG GGCACCAGCC GCCATGTGAC GCAGCGCAAC 
GAACCCGACG CGGTGGAAAT CCTGTCGGGC GTGTACGAGG GCAAGACCAC CGGCACGCCG 
ATCTGCCTGC TGATCAGGAA CACCGACCAG CGCAGCAAGG ACTACGGCAA CATCCTGGAA 
ACCTTCCGGC CCGGCCATGC CGACTACAGC TACCTGCACA AATACGGGCG GCGTGACCCC 
CGCGGCGGCG GCCGCGCCTC GGCCCGCCTG ACGGCGCCCA TGGTGGCCGC CGGCGCGGTG 
GCCAAAAAAT GGCTGGCTGA GAAATATGGC ACCAGCTTTC GCGGCTGCAT GGCGCAGATT 
GGCGACATCG CGATTCCCTT TGAGTCCTGG GAGCATGTGC CGCGCAATCC CTTCTTTGCG 
CCGGTGGCCG ACGTTTCCCA CCTTGAAGAC TACATGGATG CACTGCGCAA GGCCGGTGAC 
TCCTGCGGCG CGCGCATCCG GGTCACCGCT TCCGGTGTGC CCGTCGGGCT GGGCGAGCCG 
CTGTTTGACA AGCTCGATGC CGACATCGCA TTTGCCATGA TGGGGATCAA TGCCGTCAAG 
GGCGTGGAGA TCGGCGCCGG CTTTGCCAGC GTGACCCAGC GCGGAACAAC CCATGGCGAC 
TCACTGTCGC CCGAAGGTTT CCTTTCGAAC AATGCCGGTG GTGTGCTCGG CGGCATCAGC 
ACTGGGCAGG ACCTGGAAGT CTCGATCGCC ATCAAGCCCA CGAGCTCCAT CATCACACCG 
CGCCAGTCGA TAGACACGGC GGGCAACCCC GCCGAGGTGG TGACCAAGGG CCGGCACGAC 
CCCTGCGTGG GCATTCGCGC CACGCCGATT GCCGAGGCCA TGCTGGCGCT CGTCGTGATG 
GAGCATGCGC TGCGCCAGCG TGCGCAAAAT GCCGATGTGA CGGTCAGCAC GCCGGACATC 
ATGCGCGCAC GCGGCTGA

Protein sequence

MSGSTFGNLF AVTNFGESHG PAIGCVIDGC PPGLALTEAD IQTDLDRRRP GTSRHVTQRN 
EPDAVEILSG VYEGKTTGTP ICLLIRNTDQ RSKDYGNILE TFRPGHADYS YLHKYGRRDP 
RGGGRASARL TAPMVAAGAV AKKWLAEKYG TSFRGCMAQI GDIAIPFESW EHVPRNPFFA 
PVADVSHLED YMDALRKAGD SCGARIRVTA SGVPVGLGEP LFDKLDADIA FAMMGINAVK 
GVEIGAGFAS VTQRGTTHGD SLSPEGFLSN NAGGVLGGIS TGQDLEVSIA IKPTSSIITP 
RQSIDTAGNP AEVVTKGRHD PCVGIRATPI AEAMLALVVM EHALRQRAQN ADVTVSTPDI 
MRARG