Gene Rmet_5416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_5416
Symbol	aslA
ID	4042277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	+
Start bp	2160936
End bp	2162675
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	62%
IMG OID	637980834
Product	arylsulfatase-like enzyme
Protein accession	YP_587544
Protein GI	94314335
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.443584
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCAAG CTGAAATGAG AAAGACAAGA ATCGGGGGAC TGGCGACGCT TGCCATTGCC 
GCTGCCGTAC TGACATTGGC GGGCTGCGGC AAGCAGGAAG AGCCCAAGGC ACCGGCAGCA 
CAAGCACCAG CCGCGCAATC TTCCGCCGAG GCGCCTGCAG CGCCGCAGGC CGCCCGCGAG 
AATCCCCCTG TCGCCGCGAA TGCACCGGAG TCGGCAGCTT CCGCGCCGGC ACTGCCGCCG 
GTGGCCAATT CAGGCAAGAA GCCGAACATC CTGGTGATCT TCGGTGACGA CATTGGCCAG 
ACCAACATCA GCGCCTACAG CCATGGCGTG GTTGGCTACC GCACCCCGAA CATCGATCGC 
ATCGCCCGTG AGGGGATGAT GATGACCGAC TACTACGGCG AGAACAGCTG TACCGCGGGC 
CGCTCTACCT TCATCACTGG TGAAGTCGGC TTGCGTACCG GCCTGCTGAA GGTCGGCATC 
CCCGGCGCGA CCGTGGGCCT GCAGGCGCAG AACGCGACCA TTGCCGAAGC GCTGAAGCCG 
CTTGGCTATG CCACCGGCCA GTTCGGCAAG AACCACCTTG GCGACCGCAA CGAATACCTG 
CCGACCGCGC ACGGCTTCGA CGAGTTCTAC GGCAACCTGT ATCACCTGAA CGCCGAAGAG 
GAGCCGGAGC GTCCGTATTA TCCGAAGAAC GATGCGGCCT TCGTGAAGGC AAATTCGCCG 
CGTGGCGTGA TCCACTCGTT CTCCGACGGC AAGGTGGAAG ACACCGGCCC ACTGACGCGC 
AAGCGCATGG AGACCATCGA CGACGAGACC ACGGCAGCAG CCATCGGCTT CATGGAGAAG 
CAGGTCAAGG CGGACAAGCC GTTCTTCGTG TGGATGAACA CCACCCGCAT GCACTTGTTC 
ACCCATGTAC GCGAGTCGAT GCGCGGCCAG AGCGGTATGC CGGGCAACGA GTACGCGGAC 
GGCATGCTCG AGCATGACGC CGACGTGGGC AAGCTGCTCA GGACGCTCGA CGACCTGAAG 
ATCGCCGACA ACACCATCGT GGTCTACACG ACGGACAATG GCCCGAACCA GTTCAGCTGG 
CCGGATGCGG CAACCACGCC GTTCCGCAGC GAGAAGGACA CCAACTGGGA AGGCGCATTC 
CGCGTGCCGG CGCTGGTGAA GTGGCCGGGC CGCATCAAAC CGGGCACGGT CTCCACAACG 
ATGATGTCCG GCCTTGACTG GTTCCCCACG CTGCTTGCGG CCGCGGGCGA TACCGACATC 
AAGGAACGAC TGCTCAAGGG CACCAGCCTT GGTGGCAAAT CGTTCAAGGT GCATCTGGAC 
GGCTATAACT TCCTGCCGTA CCTGACCGGG CAGACCAATA CCGGCCCGCG CCAGGACTTC 
TACTACTTCA ACGATGACGG GCAACTGGTC GCCTATCGCT ACAACGACTG GAAAATCGTC 
TTCTGTGAGC AGCGGCAGCC AGGCGGCTTC CAGGTGTGGT CCAACCCGTT CACCTGCTTG 
CGCGCACCCA AGGCGTTCAA CCTGCGCATG GACCCATACG AGCGCGCCGA TACGGTATCC 
GATCAATACT ATGACTGGGC CACGAAGAAC GCCTACCTGA TGCAGTACGG CGTCTATCGC 
GTGATTCCGT TCCTTCAAAC GTTCAAGGAC TATCCGCCCA GCCAGCGTCC CGCGAGCTTC 
AGTATCGACC AGGCGGTCGA GCAACTGATG AAGACGCTGG ACAAGACGCC AGCCAAGTAA

Protein sequence

MRQAEMRKTR IGGLATLAIA AAVLTLAGCG KQEEPKAPAA QAPAAQSSAE APAAPQAARE 
NPPVAANAPE SAASAPALPP VANSGKKPNI LVIFGDDIGQ TNISAYSHGV VGYRTPNIDR 
IAREGMMMTD YYGENSCTAG RSTFITGEVG LRTGLLKVGI PGATVGLQAQ NATIAEALKP 
LGYATGQFGK NHLGDRNEYL PTAHGFDEFY GNLYHLNAEE EPERPYYPKN DAAFVKANSP 
RGVIHSFSDG KVEDTGPLTR KRMETIDDET TAAAIGFMEK QVKADKPFFV WMNTTRMHLF 
THVRESMRGQ SGMPGNEYAD GMLEHDADVG KLLRTLDDLK IADNTIVVYT TDNGPNQFSW 
PDAATTPFRS EKDTNWEGAF RVPALVKWPG RIKPGTVSTT MMSGLDWFPT LLAAAGDTDI 
KERLLKGTSL GGKSFKVHLD GYNFLPYLTG QTNTGPRQDF YYFNDDGQLV AYRYNDWKIV 
FCEQRQPGGF QVWSNPFTCL RAPKAFNLRM DPYERADTVS DQYYDWATKN AYLMQYGVYR 
VIPFLQTFKD YPPSQRPASF SIDQAVEQLM KTLDKTPAK