Gene Sama_0939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_0939
Symbol
ID	4603191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	1135041
End bp	1136564
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	52%
IMG OID	639780274
Product	tryptophan halogenase
Protein accession	YP_926816
Protein GI	119774076
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.220698
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAA CGAAAATTGC TATCCTGGGT GGTGGTACTG CCGGTTGGTT GGCGGCCAAC 
CATTTGGGGG CGGAGCTGTG TGCCGATAAG GAGGTTGAAA TAACCCTTAT CGAATCGCCG 
GAGATCCCAA CCATTGGTGT GGGGGAGGGC ACCGTGCCCT ATATCATGAA AGGCCTCAAA 
CGCTTTGGCA TATCTGAGTC CGAGCTGCTG GCAAACTGTG ATACCACCTT CAAGCAGGGC 
ATTAAGTTCG TCAATTGGCT CGACCCTGAG CGCCACGGCG ATAACCACTA TTACCATCCT 
TTCGACTCAC CTTATCCCGG TGGCATGGAC ATCAGCCATT ACTGGCTGAC CCAAAAAGAT 
AAGCGCCCCT TTGATGATGT GGGTATACAG GCCCGGATTT GTGAAAAAAA CCTGGCTCCC 
AAGCGTATCA GTGCTCCCGA ATATCAGGGT GAACTGGCTT ACGCCTATCA TTTCAATGCG 
GTGAAGTTTG CTGCCTTGCT GGCTAAGAAC GCCCGGGAGC GCTTTGGGGT CAAGTATCTG 
AGTGCCACAG TCGCAGGCGC GACGCTGAAT GACGACGGCG CCATTGCCAG TCTGAATACC 
AAGGAAGTCG GTAGCTTGGC GTTCGATTTT TATGTCGATT GCAGCGGTTT TCACTCGGTA 
CTGTTGGACA AGGTGCTTAA GGTGCCCTTT GTGGATAAAG GCAAAGAGCT GTTGACCGAC 
TCAGTGATAG TACAGCAGGT TCCCTTGAAG AGCGGTGAGG CGCTTTCGCC CTATACCAAG 
GCGACTGCGC ATAAGGCGGG CTGGATTTGG GATATCCCTC TAACCACCCG TCGGGGTACC 
GGTTTCGTGT ATTGCAGCCA ATACATGAGC GATGAAGAGG CCGTTTCCAC CTTTGCCCAA 
TACCTTGGCA TGGACGTGAG CGAGATATCG CCAAGAAAGA TCCCGATGAA GATTGGTTAT 
CGGGAGAAGT TTTGGGCCAA AAATTGCGCC ACCCTGGGGC TTGCTCAGGG CTTTGTGGAA 
CCACTGGAAG CCACCTCGAT ACTGGTAACG GACTTTTCTG CAGAACTGCT GGCCAAAAAC 
TTCCCCAGGG AAACCTCTGA TATTGAGGTA CTTAGCCCTT ACTACAATGA TGTCATTACT 
TATGTATGGG AAAGGGTCAT CGATTTTATC AAGCTGCATT ACTGTCTCTC AGACAGGGAA 
GATACCGGCT TTTGGGCAGC CAATCGCGAT TCCGACACCT GGTCCGAGAC CCTAAAATCC 
CGACTGGCAA AGTTTGCACT CAGGCCTCCT CAGCAATCGG ACTTTTTAAG CCGTTTTGAT 
TTATTCGATG ATAAAAACTT CCTGTATGTG CTCTATGGAA TGGGCTTTTC AAGCCGTATC 
AAGGCGCTCG ACCCGAGGGA GATAGAGCAG AGCAGGCAGC TGTTGGAGAG TAACGACAAA 
TTGGCTGACA GGGCGGAGGA GTTGTTGATG GAGCACGGAA AGTGGCTCGC AGGTCTGAAG 
GCGGCCATGG CACGGGCATC ATAG

Protein sequence

MKITKIAILG GGTAGWLAAN HLGAELCADK EVEITLIESP EIPTIGVGEG TVPYIMKGLK 
RFGISESELL ANCDTTFKQG IKFVNWLDPE RHGDNHYYHP FDSPYPGGMD ISHYWLTQKD 
KRPFDDVGIQ ARICEKNLAP KRISAPEYQG ELAYAYHFNA VKFAALLAKN ARERFGVKYL 
SATVAGATLN DDGAIASLNT KEVGSLAFDF YVDCSGFHSV LLDKVLKVPF VDKGKELLTD 
SVIVQQVPLK SGEALSPYTK ATAHKAGWIW DIPLTTRRGT GFVYCSQYMS DEEAVSTFAQ 
YLGMDVSEIS PRKIPMKIGY REKFWAKNCA TLGLAQGFVE PLEATSILVT DFSAELLAKN 
FPRETSDIEV LSPYYNDVIT YVWERVIDFI KLHYCLSDRE DTGFWAANRD SDTWSETLKS 
RLAKFALRPP QQSDFLSRFD LFDDKNFLYV LYGMGFSSRI KALDPREIEQ SRQLLESNDK 
LADRAEELLM EHGKWLAGLK AAMARAS