Gene Dfer_2234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dfer_2234
Symbol
ID	8225806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dyadobacter fermentans DSM 18053
Kingdom	Bacteria
Replicon accession	NC_013037
Strand	+
Start bp	2742677
End bp	2744197
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	53%
IMG OID	644930070
Product	sulfatase
Protein accession	YP_003086621
Protein GI	255036000
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGCA TCCTGACCTT ACTGATTACC CTGACGACCA CATTTTGTTT CGGGCAGACT 
AAGAAGAAAC CCAACATTCT GTACATCATG TCCGACGACC ACACCTCGCA GGCGTGGGGC 
ATTTATGGGG GTATACTGAA AGATTACGTA AAAAACGACC ACATCGAATG GCTGGCGGCG 
AATGGCGCTA CGCTGGGTAA TGCATTCTGT ACCAACTCGA TATGCGTGCC CAGCCGCGCG 
GCAATCCTGA CCGGCCGGTA TAGCCATCGA AACGGCGTGT ATGATTTGAG CGATTCACTC 
AGCCCCGATA GCTTAAACTA CGCCAAACTG CTGAAAACGG CCGGCTACCA GACGGCGCTG 
ATCGGTAAAT GGCATTTGGT GAAAGAACCG GCGGGATTTG ACTACTACTG CGTGCTGCCC 
GGCCAGGGAC GTTACCGGAA CCCCATCATG ATGACGAAAG AGGATTTCCG GGAAGACCAG 
AAAGGGGGCA AAGTGTATGA AGGCTATTCG ACGGACGTGA TCACCGACCA ATCCATTGCC 
TGGCTCGAAA AGCGGGACAA AAGTAAGCCG TTTTACCTCT CCACCCATTT CAAAGCCACC 
CACGAGCCGT TTGATTATCC AAAACGCTAC GAAAATTACC TCGAAGACGT AGAGATCCCC 
TACCCTGCGG ACTTCGCCGA CCGCGGTGCC ACGGGTTCGG GCCGCACGCA CGACGGCTGG 
CCGCTGGACC TCCTCGGCAC GCGCTACGAA AAAGGTACCG GTAAGGAATA TCCGGGCCAT 
TCGTTTTCAT TGCAGGGGCT GGATTCGGTA GCCGCGCGAA AAAAGATTTA CCAGAAGTTT 
GTGAAGGATT ATATCCGCTG CGGCGCCGCC GTCGACGACA ACATCGGCCG CCTGATCCAA 
TATCTGAAAG ATGCGGGCGA GCTGGACAAT ACGATCATCA TTTACACATC CGACCAGGGC 
TATTTCCTCG GCGAACACGG CTTTTTCGAC AAGCGGTTTA TCTACGAACC GTCGATCCGC 
ATGCCGTTCG TGATCAGCTA TCCGAAGGAA ATTCCGAAAG GCAAAAGGGT TAACGACCTC 
ATTCTCAATA TCGACTTCGC GTCGCTGTTC CTCGATTATG CCGGCATTGC GCCGCCCGCA 
TCCATGCAGG GCAAAAGTTT CCGCAAAAAC TTGCAGGGGA AAACGCCCGC TCATTGGCGG 
AAGGACATTT ACTATCGCTA TTGGGCCAAT GAACCGAACC GCCCGGCGCA TTTCGGCATA 
CGGACGGACC GGTACAAGCT GGCATTTTTC TACGGGCAAT CGAGGACCAA AACCGCCCGG 
GACAACATGA AATACCCGCC GGGCTGGGAA TTTTATGATT TGAAAAACGA TCCGGGCGAA 
GATCGCAATG CCATTCTCGA TCCGCAATAC AAAGACATCA TTGCCAAACT GAAAGCCCGT 
CTGAAAGACA TTAAAAAGGA AAGCGGCGAC GGCGTGGAAT CGAACCCGAC CATTGAGGAA 
TTGATCCAAC AGAATTGGTA G

Protein sequence

MKRILTLLIT LTTTFCFGQT KKKPNILYIM SDDHTSQAWG IYGGILKDYV KNDHIEWLAA 
NGATLGNAFC TNSICVPSRA AILTGRYSHR NGVYDLSDSL SPDSLNYAKL LKTAGYQTAL 
IGKWHLVKEP AGFDYYCVLP GQGRYRNPIM MTKEDFREDQ KGGKVYEGYS TDVITDQSIA 
WLEKRDKSKP FYLSTHFKAT HEPFDYPKRY ENYLEDVEIP YPADFADRGA TGSGRTHDGW 
PLDLLGTRYE KGTGKEYPGH SFSLQGLDSV AARKKIYQKF VKDYIRCGAA VDDNIGRLIQ 
YLKDAGELDN TIIIYTSDQG YFLGEHGFFD KRFIYEPSIR MPFVISYPKE IPKGKRVNDL 
ILNIDFASLF LDYAGIAPPA SMQGKSFRKN LQGKTPAHWR KDIYYRYWAN EPNRPAHFGI 
RTDRYKLAFF YGQSRTKTAR DNMKYPPGWE FYDLKNDPGE DRNAILDPQY KDIIAKLKAR 
LKDIKKESGD GVESNPTIEE LIQQNW