Gene CPS_1022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPS_1022
Symbol
ID	3522939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Colwellia psychrerythraea 34H
Kingdom	Bacteria
Replicon accession	NC_003910
Strand	+
Start bp	1045984
End bp	1047558
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	38%
IMG OID	637283487
Product	putative tryptophan halogenase
Protein accession	YP_267771
Protein GI	71282464
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGCCT TAGATAATAA TCATATTCTT ATAATTGGCG GTGGCACTGC TGGTTGGTTA 
AGTGCGGCAA TACTTGCCAA AACGTTGAAT AGTAAAAATA CTGATGGTGT TAAAGTCACT 
TTGGTTGAAT CGCCGACCAT TCCAATTTTA GGTGTTGGAG AAGGCACATG GCCAAACTTA 
AGAGCGACAT TACATAAAAT AGGTATTAGC GAAACAGACT TCATTCGTGA ATGCGATGCG 
ACCTTTAAAC AAGGTGCAGA GTTTATTAAT TGGTCTAAAA CGCCAGAGCC AAAACAATCA 
CACAGTTATT ATCACCCACT CAGTACGGTT AGCCATTCTT CATACGATTT TAACTTAGCC 
CCTTATTGGT TACAACAAGA TAAAAAAACA CGCTTACCTT ATGATAGAGC TGTTGCATCA 
CAAGCAAGAG TTTGTGATGA AGGACTAGCA CCTAAACAAA TTGTGATGGC AGAATATAGT 
GCCGCGCAAG AGTATGCCTA TCATTTAAAT GCGAATAAAT TGGCCGAGTT TTTAAAACGG 
CATTGCGTTG AGAAACTTGG GGTTAAATTT GTCAGTGCCA ATGTCACCAA TGTAGCGCTA 
GATAATGAAG ACTTTATCAC GCATGTAGAC ACTGACCATG AAAGTGAAAA GAAAATTTTC 
GCTGATTTTT TTGTCGATTG TAGCGGTGCG AAAGGGTTAA TCATTAAAGA AACCTATAAC 
ACAGCTTGGC AAAGTATTAG CGATGTTATT TTTAATGATA CCGCCTTAGC AGTACAAGTA 
CCTTATGCTG ATAGAAATCA AAAAATAAAT ACCCATACTC TCGCAACAGC CCAAGAAGCA 
GGTTGGATAT GGGATATAGG TTTACAGGAC CGTCGTGGAG TTGGTCATGT ATTTAGTAGC 
AAGTACATCT CAGATCAAAA AGCCGAGCAA CAACTTATTG ATTATCTAGG GGATGATTAC 
AGCGACGATT TGACTATTCG TAAAATAAAG CTCAACCATG GTTACCACAA GAAGTTCTGG 
CATAAAAACA GTGTGGCTAT TGGTATGTCG GCGGGCTTTG TTGAGCCACT TGAAGCATCG 
GCTATTTTCT TATTTGATGC CGCAGCTAAT ATGCTTGCAG CACAGTTTCC TCGTGATAAA 
GCACAAATGA AATATGCTGA AGACAAATTT AATCAGCAAT TAACGATGCG TATGCAGCGT 
ACGGTTGAGT TTATTAAATT GCATTACTGT ATTTCTCAAC GCCGAGATAG CCAATACTGG 
ATTGATAACT GTGACCCAAT CAGTATCCCT GATAACTTAA AGCAACGACT GGCATTTTGG 
CAAGGACAAG TACCAACCAA ATATGACTTT GAAAACGCTT GGGAACCCTT TAATTTAGAC 
AGTTATCTTT ATGTTCTATA TGGTATGGGG TTTGAAACTG ATGTAGCTAA AGTTGCAGCT 
AAATATACTG AAACAACTAA AGCTAAGCAC TTATTTAATA ATATTGATAA AGCCAGTGTG 
CTGTTAATCG ATAAGTTACC TAAGCAAAGA GAGCTGATTG AAAAAGTAAT TAAATATGGG 
TTTACTCAAG TATAG

Protein sequence

MMALDNNHIL IIGGGTAGWL SAAILAKTLN SKNTDGVKVT LVESPTIPIL GVGEGTWPNL 
RATLHKIGIS ETDFIRECDA TFKQGAEFIN WSKTPEPKQS HSYYHPLSTV SHSSYDFNLA 
PYWLQQDKKT RLPYDRAVAS QARVCDEGLA PKQIVMAEYS AAQEYAYHLN ANKLAEFLKR 
HCVEKLGVKF VSANVTNVAL DNEDFITHVD TDHESEKKIF ADFFVDCSGA KGLIIKETYN 
TAWQSISDVI FNDTALAVQV PYADRNQKIN THTLATAQEA GWIWDIGLQD RRGVGHVFSS 
KYISDQKAEQ QLIDYLGDDY SDDLTIRKIK LNHGYHKKFW HKNSVAIGMS AGFVEPLEAS 
AIFLFDAAAN MLAAQFPRDK AQMKYAEDKF NQQLTMRMQR TVEFIKLHYC ISQRRDSQYW 
IDNCDPISIP DNLKQRLAFW QGQVPTKYDF ENAWEPFNLD SYLYVLYGMG FETDVAKVAA 
KYTETTKAKH LFNNIDKASV LLIDKLPKQR ELIEKVIKYG FTQV