Gene Sbal223_2301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_2301
Symbol
ID	7087715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	2742864
End bp	2744363
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	44%
IMG OID	643461199
Product	tryptophan halogenase
Protein accession	YP_002358223
Protein GI	217973472
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.315145
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.236324
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAAA TCAAAGATAT CGTCATTGTC GGTGGCGGTT CTTCAGGTTG GATGACGGCG 
GCCATGTTGG CAAGATTGTT TAAATCAACA CTGAATATCA CCCTGATTGA ATCTGAAGAT 
ATAGGCACAG TGGGCGTAGG TGAAGCCACC ATTCCACCAC TGCAAATATT CAATAACGTC 
CTTGGGATTT CCGAAGCCGA TTTTATCAAT GCCACCCAAG CAACGTTTAA ATTGGGTATT 
CAATTCGAAA ATTGGGGCAA ACCGGATGAA GCCTATATGC ATGCTTTTGG CAATATAGGT 
AAAGATATAG GTTTTACTCA ATTTCATCAT TACTGGCTCA GCACCTCCCC AAAAGAGGTC 
AATTCGTTTT GGGATTATTC GGTTAATTAC CAAGCGGCAA AACACAATAA ATTTCAAGTA 
CTCCAGCAGA TCCCAAACTC TCCCCTTGCC GGCTTAACTC ATGCTTATCA TTTCGATGCA 
GCGCTCTATG CCCAATTTTT ACGACGTTTC AGTGAGCAAC TCGGAGTAAA GCGTATCGAA 
GGCAAAATTA CGGCGGTTGA ACTCACGCCA AACGGCGATA TTGAAAGTGT AATCTTAGGA 
ACAGGACAAA CCGTAAAAGC CGATTTCTTT ATAGATTGCT CGGGCTTTGC CGCGCTACTG 
ATAGAAAAAG CGCTCAAGGT TGGCTTCGAT AGCTACCAAC ACTGGCTCCC CTGCGACAGC 
GCCTATGCCG TACCCTGCGA AAAAACGCCA GCAATAACGC CTTATACGCG TTCTATCGCC 
CATGATGCGG GTTGGCAATG GCGGATCCCG CTGCAGCACC GCACAGGCAA TGGGTTAGTC 
TATTGCAGTC GCTATATCAA TGATAACGCC GCCAAACAGC TTTTACTCAA TAATTTAGAT 
GGTAAGCCGT TGGCTGAACC TAAGAAAATC AATTTCACGA CCGGACGACG AATCAAGCAG 
TGGCATAAAA ATTGTGTCGC CATCGGCCTT TCGAGTGGAT TCTTAGAGCC TTTAGAATCC 
ACCAGCTTGC ATTTAGTCCA ATCAGCGATT ATTCGCTTGA GTAAACTCTT TCCACATCAA 
GGAATTGCAC AAGCGAATGT CGATGAGTTT AATCGCCAGT CCCAACTTGA ATTTGAACAA 
ATCCGCGATT TTATTATCTT GCACTATCAT TTAAACCAAA GGGAAGATGC TCAGGAAAAT 
GGGTTTTGGC ATCAATGCCG AACCATGGTT CTGCCAGAGA GTTTACAGCA AAAAATCGCC 
CTATTTCGTG CCACAGGCAC AGTGTTTAGA CATCAAGATG AACTTTTTAC CGAAGCAGCA 
TGGATTCAAG TCATGTTGGG GCAAGGCATT AGGCCTCGAG ATTTCAATCC ATTAGCGGCA 
ACCATTCAAC CGCAAGCACT GAGTGAATTT CTGCTCAACA TGCGCACCAT TATTGATAAT 
ACCGTCACTA AGCTACCTAC CCATGATCAG TATTTAGCGC ACTTATCGAC ACATAAATAA

Protein sequence

MNKIKDIVIV GGGSSGWMTA AMLARLFKST LNITLIESED IGTVGVGEAT IPPLQIFNNV 
LGISEADFIN ATQATFKLGI QFENWGKPDE AYMHAFGNIG KDIGFTQFHH YWLSTSPKEV 
NSFWDYSVNY QAAKHNKFQV LQQIPNSPLA GLTHAYHFDA ALYAQFLRRF SEQLGVKRIE 
GKITAVELTP NGDIESVILG TGQTVKADFF IDCSGFAALL IEKALKVGFD SYQHWLPCDS 
AYAVPCEKTP AITPYTRSIA HDAGWQWRIP LQHRTGNGLV YCSRYINDNA AKQLLLNNLD 
GKPLAEPKKI NFTTGRRIKQ WHKNCVAIGL SSGFLEPLES TSLHLVQSAI IRLSKLFPHQ 
GIAQANVDEF NRQSQLEFEQ IRDFIILHYH LNQREDAQEN GFWHQCRTMV LPESLQQKIA 
LFRATGTVFR HQDELFTEAA WIQVMLGQGI RPRDFNPLAA TIQPQALSEF LLNMRTIIDN 
TVTKLPTHDQ YLAHLSTHK