Gene Sbal195_4201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal195_4201
Symbol	aroB
ID	5756029
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS195
Kingdom	Bacteria
Replicon accession	NC_009997
Strand	-
Start bp	4964949
End bp	4966025
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	46%
IMG OID	641290554
Product	3-dehydroquinate synthase
Protein accession	YP_001556619
Protein GI	160877303
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000411195
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAAA TTCAGGTTGA TTTAGGTGTA CGTAGTTATC CCATTTACAT TGGCCAGAAT 
TTGATGAGTG ATGGCGAGAC CTTGTCTCGC TACCTGCTTA AAAAACGTAT TCTTATCGTC 
ACCAATGAAA CTGTCGCGCC TTTGTATCTT AAACAGATAC AAGAGACGAT GGCTTCGTTT 
GGTGAGGTAG AGAGTGTTAT CCTCCCCGAT GGTGAACAAT TCAAAGACTT AGCGCATCTA 
GATACTATTT TTACTGCATT GCTGCAGCAA AACTATGGTC GAGATTCTGT GCTGGTGGCT 
TTGGGTGGCG GCGTAATTGG TGATATGACG GGCTTTGCCG CGGCATGTTA TCAACGTGGG 
ATCGATTTTA TTCAAATTCC GACAACCCTA TTGTCGCAGG TGGATTCTTC CGTCGGCGGT 
AAAACGGCTG TTAACCATCC TCTTGGTAAA AACATGATTG GGGCCTTTTA TCAGCCACAA 
ATCGTGCTTA TCGATACTTT ATGTTTACAT ACGCTTCCAG CGCGCGAGTT TGCGGCGGGA 
ATGGCGGAAG TCATCAAGTA TGGCATCATG TGGGATGCTG ATTTTTTTCA ATGGCTTGAA 
GATAATGTAA CGGCACTAAA AACCTTAGAT GCCCAAGCAT TGGTTTATGC TATCTCCCGT 
TGCTGTGAGA TTAAGGCCGA TGTGGTTAGC CAAGACGAAA CTGAGCAGGG TGTACGTGCT 
TTATTGAATC TAGGTCATAC CTTTGGTCAT GCGATTGAAG CCGAAATGGG CTACGGTAAT 
TGGTTGCATG GTGAAGCCGT GTCAGCTGGC ACAGTCCTTG CTGCTCAAAC AGCTAAGGCA 
CTGGGGCTTA TCGATGAGTC AATAGTTTGT CGTATCATAC AGTTACTACA AGCTTTTGAT 
CTTCCAGTGA GTGCGCCGGA ATCTATGGAT TTCGACAGTT TCATTCAACA TATGCGACGC 
GATAAAAAAG TTTTAGGCGG TCAGATTCGA CTGGTGCTCC CAACGGCAAT AGGCCGCGCG 
GATGTGTTTA GTCAAGTCAC AGAATCTACC CTTGAACAGG TTATTCGCTG CGCATAA

Protein sequence

MKQIQVDLGV RSYPIYIGQN LMSDGETLSR YLLKKRILIV TNETVAPLYL KQIQETMASF 
GEVESVILPD GEQFKDLAHL DTIFTALLQQ NYGRDSVLVA LGGGVIGDMT GFAAACYQRG 
IDFIQIPTTL LSQVDSSVGG KTAVNHPLGK NMIGAFYQPQ IVLIDTLCLH TLPAREFAAG 
MAEVIKYGIM WDADFFQWLE DNVTALKTLD AQALVYAISR CCEIKADVVS QDETEQGVRA 
LLNLGHTFGH AIEAEMGYGN WLHGEAVSAG TVLAAQTAKA LGLIDESIVC RIIQLLQAFD 
LPVSAPESMD FDSFIQHMRR DKKVLGGQIR LVLPTAIGRA DVFSQVTEST LEQVIRCA