Gene CPS_3700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPS_3700
Symbol
ID	3518393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Colwellia psychrerythraea 34H
Kingdom	Bacteria
Replicon accession	NC_003910
Strand	+
Start bp	3849914
End bp	3851398
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	39%
IMG OID	637286148
Product	putative tryptophan halogenase
Protein accession	YP_270368
Protein GI	71278800
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGATA AAATTGAAAA TATTGTTATT GCTGGTGGCG GCACCGCTGG TTGGATGGCG 
GCAGCAGCTT TTTCAAAACT ACTAGGGAAG AACTTAAATA TCACCTTAGT TGAGTCAGAT 
GACATTGCCT CAGTAGGCGT AGGTGAAGCC ACCATACCTC CGATAAAAAC ATTCCATAAA 
TTACTCGGTA TTAATGAGCA AGAAGTTATG CGAGCCACGC ATGCCACTTT TAAACTCGGT 
ATAGGATTTG AAAACTGGGG ACAACAAGGT GATCATTACA TTCACTCCTT TGGCGTCACA 
GGTAAAGAAT GTTGGGCAGG TGAATTCCAT CATTTTTGGT TACATGGTCT TCGCAAGGGT 
ATTAAAGCCG ACTTTGGTGA TTATTGTTAT GAGTTACAAG CAGCGAAAGC AAATAAGTTT 
GCTTTATCAA AGAACACGCC GATTAATTAT GCGTATCACC TTGATGCCAC ACGCTACGCA 
AAATATTTAC AAGAATTTAG TAAAAAACTG GGCGTAACTC GTGTCGAAGG AAAAATTCAA 
CAGGTAAATA AAGGTAATAA AACAGGCGAA ATAAACTCAC TTACACTAGC TTCAGGACAA 
GTCATTGAAG GTGACTTTTT TATAGATTGT ACTGGTTTTC AGGGGCTTTT AATTGAACAA 
GCTCTTCACA CTGGATTTGA TGATTGGTCA CACTGGTTAC CCTGTGATAG AGCGGTAGCA 
GTGCAAACCA AAGCGGTTGC AGCACCTTTA CCTTACACAC GTTCAATAGC CCGGAAAAGT 
GGCTGGCAAT GGAGAATACC ATTACAAAAT CGTGTTGGTA ATGGCCTGGT TTTTTGTAGT 
AAATATTGCT CAGATGAAGA AGCGATAAGT ACGTTAACAG CAAACATCGA AGGGGAGTTA 
CTTACAGAGC CACGAATCAT AAAATTTAAC ACCGGCCGCC GTCGAAAGGG TTGGAATAAA 
AACTGTGTAG CTTTAGGTTT ATCAAGTGGT TTTATCGAAC CTCTTGAGTC AACAAGTATT 
CATTTAATTA TGTCTGGAAT TATCCGCTTA TTACGTTTAT TTCCTTTTGA TGGCATCCAT 
CAATCAGCTA TTAATGAATA CAATAACAAA CTCGATTCAG AATTAAACGC CGTTCGTGAC 
TTTATCATAC TACATTACAA AGCAACTCAG CGTGAAGATA GTAATTTTTG GTTACATTGT 
AAGAATATGG AAATCCCCCC TTCCCTAGTG CATAAAATGC AATTATTTAA AGATACAGGT 
CGTGTCTTTT TAGATGATGG CGATATTTTC CGCGTAGACT CTTGGACCCA AGTAATGCTC 
GGCCAAGGCA TTATGCCAAC GCAGTACCAC AAAATAGCTG AAATAATGAA TGATAAAGAG 
CTGGAGAACT TCATGAGTAA CCTGAAAGCA TCGATAACTA ATGCTGTTGA ACAATTACCT 
AGTCACACAG AATTTATACA AAGTTATTGT AAATCAGACT ATTAA

Protein sequence

MKDKIENIVI AGGGTAGWMA AAAFSKLLGK NLNITLVESD DIASVGVGEA TIPPIKTFHK 
LLGINEQEVM RATHATFKLG IGFENWGQQG DHYIHSFGVT GKECWAGEFH HFWLHGLRKG 
IKADFGDYCY ELQAAKANKF ALSKNTPINY AYHLDATRYA KYLQEFSKKL GVTRVEGKIQ 
QVNKGNKTGE INSLTLASGQ VIEGDFFIDC TGFQGLLIEQ ALHTGFDDWS HWLPCDRAVA 
VQTKAVAAPL PYTRSIARKS GWQWRIPLQN RVGNGLVFCS KYCSDEEAIS TLTANIEGEL 
LTEPRIIKFN TGRRRKGWNK NCVALGLSSG FIEPLESTSI HLIMSGIIRL LRLFPFDGIH 
QSAINEYNNK LDSELNAVRD FIILHYKATQ REDSNFWLHC KNMEIPPSLV HKMQLFKDTG 
RVFLDDGDIF RVDSWTQVML GQGIMPTQYH KIAEIMNDKE LENFMSNLKA SITNAVEQLP 
SHTEFIQSYC KSDY