Gene Dfer_2051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dfer_2051
Symbol
ID	8225623
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dyadobacter fermentans DSM 18053
Kingdom	Bacteria
Replicon accession	NC_013037
Strand	-
Start bp	2499487
End bp	2500911
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	52%
IMG OID	644929888
Product	sulfatase
Protein accession	YP_003086439
Protein GI	255035818
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0158429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAAAAC TGACAAAACA CTACGCCTTT CTCGGCACCA TCCTGCTCGC CGTGTGGATC 
GGGACGTTTC CTGCATTGGC ACAAAAGAAG AAGTTCAATG TCTTGTTCAT CGCAGTCGAC 
GACCTCAACA ACGACCTGGG AACATATGGT AACACCTTCG TGAAATCGCC AAACATCGAC 
AGGCTCGCCA AGCGCGGTGT CCGTTTCGAT AAGGCGTATA CGCAATTTCC GTTATGCAGT 
CCCAGCCGCT CATCGCTGCT GACCGGCCAG CGGCCGGATA TGACCAAAAT CTACGAGCTG 
CAAACGCATT TCCGTAAAAA CCTGCCCGAC ATTGTTACAT TGCCGCAGCT CTTCAAGAAC 
AACAATTATT ACAGCGCGCG GGTAGGGAAG ATATTCCATT ACGGCGTTCC CAGCCAGATC 
GGAACCGATG GGCTGGATGA TCCCGAGTCG TGGAGTTACA GGGTGAATCC GAAAGGCCGT 
GACAAAACGG AGGAACCGTT AATCAAGAAC CTCACGCCCG ATCGTGGGCT TGGAAGCGCG 
TTGGCGTGGC GTGCCACCGA GGGCACCGAC GACGAGCAAA CCGACGGGTT GATCGCCAGC 
GAGGCCATTA AAATCATGAC CGAAAAGAAA AATGAGCCAT TTTTTCTGGC AGTCGGTTTT 
TTCAGGCCGC ATACACCTTA TGTTGCGCCG CAAAAGTATT TCGATATGTA CCCGGTGGAT 
AAAGTGCCGT TACCAAAAGA AATACCAAAC GACCTCGACG ATGTCCCGGA GGCGGCATTA 
TTCACCAAGC CACCGCATTG GGGACTCGAT GAGGCCAAAC GCCGTGAAGC TCTGCGGGCC 
TATTATGCTA CGATCACATT CATGGATGCG CAGGTAGGTA AGCTGATCGA CGCGCTGGAT 
AAACTGAAAC TGGCCGAAAA CACCATTATT GTCCTTTGGA GTGACCATGG CTACAATGTG 
GGGCAGCACG GTCAATGGAT GAAGCAAAGC CTTTTTGAAA ACTCGGCGCG CGTGCCGTTG 
ATCATCTCTG TTCCTGGCGG CACGAAAGGA AAGGCATCCG GCCGCACGGT GGAGTTGGTT 
GATATTTTTC CAACTTTGGC GGAGTTGTGC GGGCTTGATC CGAAACAAAA CCTGCAAGGC 
AAAAGTCTTA CGCCGTTATT GAAAAATCCC GCTGCGATTT GGGACAAGCC AGCTTACACC 
CAGGTGCGGA GAGGGCAGAT TTTCGGCCGC AGTGTGCGCA CTGAGCGTTT CCGCTACACC 
GAATGGGACG GTGGCAATGC GGGTGTTGAA CTGTATGATC ACCAAAAAGA TCCTGGCGAA 
TTCACCAACC TCGCCAAAGA CAACAGTTTT GTGATTACGG TAAACGAATT GGCCCTGTTG 
TTGAAAAAGG GTTATCCCGA AGCACAACAT CCGGAAGGTA AGTAA

Protein sequence

MIKLTKHYAF LGTILLAVWI GTFPALAQKK KFNVLFIAVD DLNNDLGTYG NTFVKSPNID 
RLAKRGVRFD KAYTQFPLCS PSRSSLLTGQ RPDMTKIYEL QTHFRKNLPD IVTLPQLFKN 
NNYYSARVGK IFHYGVPSQI GTDGLDDPES WSYRVNPKGR DKTEEPLIKN LTPDRGLGSA 
LAWRATEGTD DEQTDGLIAS EAIKIMTEKK NEPFFLAVGF FRPHTPYVAP QKYFDMYPVD 
KVPLPKEIPN DLDDVPEAAL FTKPPHWGLD EAKRREALRA YYATITFMDA QVGKLIDALD 
KLKLAENTII VLWSDHGYNV GQHGQWMKQS LFENSARVPL IISVPGGTKG KASGRTVELV 
DIFPTLAELC GLDPKQNLQG KSLTPLLKNP AAIWDKPAYT QVRRGQIFGR SVRTERFRYT 
EWDGGNAGVE LYDHQKDPGE FTNLAKDNSF VITVNELALL LKKGYPEAQH PEGK