Gene CPS_3032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPS_3032
Symbol
ID	3518391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Colwellia psychrerythraea 34H
Kingdom	Bacteria
Replicon accession	NC_003910
Strand	-
Start bp	3170144
End bp	3171712
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	41%
IMG OID	637285484
Product	sulfatase family protein
Protein accession	YP_269731
Protein GI	71278798
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAATTA ATACTAAATT TACGCAGTTT GCCATTGCAT TAGGGATGTT GACTGCATCT 
GCAACGGCAC TAGCAACAAC TGATACAAGC AAACCTAATA TTTTGGCAAT TTGGGGCGAT 
GATATTGGTA TATATAATAT TAGTGCTTAT AACCATGGCA TGATGGGTTA TCAAACACCT 
AATATCGACA GGATTGCAAA TGAAGGTGCA TTATTCACCG ATCAATACGC GCAACAAAGC 
TGTACGGCAG GTCGCTCAGC GTTCATTTTA GGGCAAGAAC CTTTTCGTAC CGGTTTGTTA 
ACTATCGGTA TGCCAGGTTC TACTCATGGC ATTCCTGATT GGGCCCCTAC GATAGGTGAT 
GTTGCTAAAG ATAACGGCTA CATGACCGCA CAATTTGGTA AGAACCATTT AGGTGACCAA 
GACAAACATT TACCGACTAA ACATGGTTTT GATGAGTTTT TCGGTAACCT TTATCACTTA 
AATGCTGAAG AAGAGCCGGA AACCTATTAC TACCCGAAAG ATCCAAGATT TAAGAAAAAG 
TTTGGTCCTC GCGGTGTTTT ACATACCTTT GCTGATGGTC GTATGGAAGA TACTGGCGCA 
TTAACAAGAA AGCGCATGGA AACGGCTGAT GAAGAGTTTT TAGGTGCCAC GTTAAAGTTT 
ATCGACAAAG CTCATAAGGC GGATAAACCT TTCTTTATTT GGTACAACAG TACACGAATG 
CATGTTCACA CACGCTTACA AGAAAAATGG CAAGGTAAGT CAGGCATCAG CATTTATGCA 
GATGGTATGT TAGAGCACGA TGAGCACGTA GGGGTTTTAT TAGACAAACT TGATGATTTG 
AAAATTGCTG ACAATACCAT TGTTATTTAC ACCACAGATA ATGGTGCAGA AACATTTACT 
TGGCCTGACG GTGGTAATAC TCCATTCCAT GGCGAAAAGG GTACAACTTA TGAAGGTGGC 
ATGCGTGTAC CTCAGTTAGT TAGATGGCCC GGTACTATCA AACCCGGTAG CAAAATGAAC 
TCAATGATGT CTCATATCGA TTGGATGCCA ACATTAGCTG CAGCGATGGG TAACGATACG 
TTAGTTGCTG ATCTTAAAAA AGGTGGTGAA ATAAATAACA AAAAATGGCG AGTACATTTA 
GATGGTTTTA ATTTCAAACC TTACTTTGCT GGTGAAGTTG ACAAAGGGCC ACGTGAAACG 
ATTATGTACT TTAGCCAATC AGGTCAATTA AATGCGATAC GTTGGAATGA TTGGAAAGCA 
AGTTTTGCAC TGGTTAAAGG GGATATGGCA AGTGGCACAC GTGAAGTACC AGCGTGGCCA 
CAACTAGTAA ACTTACGTGC AGACCCTTTT GAAAAAGGAC CGATTGAATC GTCTATGTAT 
GTTCGTTGGA TGGTTGATAA CATGTGGGCA TTTGTACCTG TAAGCGGCAA GGTAAAAGAG 
TTCCTAGGCT CATTAGAAGG TTACCCAATG CAAGTTGGTC AGAGTTTTGG TGCTGCCGAT 
ATAAACTACA CAACATTGCA AATGAAAGCA TTTGTTAAAA AAGTATCAAC AGAGATTAAA 
GCGAAATAA

Protein sequence

MTINTKFTQF AIALGMLTAS ATALATTDTS KPNILAIWGD DIGIYNISAY NHGMMGYQTP 
NIDRIANEGA LFTDQYAQQS CTAGRSAFIL GQEPFRTGLL TIGMPGSTHG IPDWAPTIGD 
VAKDNGYMTA QFGKNHLGDQ DKHLPTKHGF DEFFGNLYHL NAEEEPETYY YPKDPRFKKK 
FGPRGVLHTF ADGRMEDTGA LTRKRMETAD EEFLGATLKF IDKAHKADKP FFIWYNSTRM 
HVHTRLQEKW QGKSGISIYA DGMLEHDEHV GVLLDKLDDL KIADNTIVIY TTDNGAETFT 
WPDGGNTPFH GEKGTTYEGG MRVPQLVRWP GTIKPGSKMN SMMSHIDWMP TLAAAMGNDT 
LVADLKKGGE INNKKWRVHL DGFNFKPYFA GEVDKGPRET IMYFSQSGQL NAIRWNDWKA 
SFALVKGDMA SGTREVPAWP QLVNLRADPF EKGPIESSMY VRWMVDNMWA FVPVSGKVKE 
FLGSLEGYPM QVGQSFGAAD INYTTLQMKA FVKKVSTEIK AK