Gene Dfer_3653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dfer_3653
Symbol
ID	8227238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dyadobacter fermentans DSM 18053
Kingdom	Bacteria
Replicon accession	NC_013037
Strand	+
Start bp	4451213
End bp	4452733
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	54%
IMG OID	644931485
Product	peptidase M28
Protein accession	YP_003088023
Protein GI	255037402
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0164431
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTAT CATTACTTCT GTTACCACTC GGTCTGGCCC TTACCCTTCC TGCCGAAGCC 
CAGAAAAAAA CACAGTCATT ACCTGAGTTT CAGGTCAAAA AATCGGAAAC CGAAGCGCAT 
ATCCGCTTCC TTGCAGGCGA CGAGCTGATG GGCCGCCGCA CGGGCGAGCA GGGTAACTTT 
GTAGCAGCGC GCTACATTGC CGAGCAATTC CGGAAAATGG GCGTGGTACC CGCGCCAGGC 
AATACCGAAA CGGGCACATC GAGCTATTTC CAACGCGTTC CTTTCGAAAA AATGGGTGCT 
AACGGCACCG GCGAGATCGC CGCGGATGCC GAGATCATGA AAAGCGGCAC CGACTGGATA 
CTCATGGCCG GCGAAGCCGT AGAGCTCAAA GCGCCGATCA TTTATGCCAG CTACGGCCTT 
GAAAACGCAG CCAAAAGCTG GGATGACTAC AAAGGGTTGG ATGTGAAAGG AAAAATCGTG 
CTGGTGGAAA GCGGCACGCC CGAGAACCAG ACACCCTCGG AAATCTTCGC TACTTCTGCC 
GAAAAACGTA CAATAGCTAT CGACAAAGGC GCTATCGCGG TGATAGAGCT TTTTAACGCA 
CCTATTCCCT GGAATGTGGT GAGTAAGTTT TTTGCAGGAG AAAAAATATC GCTGGCCGAA 
GGCACGGCTT CCCAATCCAT CCCGCATGCG TGGGTAAACG GCAAGGAGGC CAAATTCGCC 
CGGGCATTGC GCGCGGTGAA AGAGGTGACG TTCAAAACCT CGGGCCGTGT TGCAAAACCC 
ATTTACAGCT ATAATGTAGC CGGCTACATT CCAGGCACCG ATCCCAAACT GAAAGAGGAA 
TATGTGCTCC TTTCCGCACA TTACGATCAC GTGGGCGTAG GCAAGCAGGG CGGGCAAACG 
TACACGCCGG AGGACAGCAT TTTCAACGGC GCCCGCGACA ATGCATTCGG CGTTACCGCG 
TTGCTCACCG CGGCCGAAGC ATTGGCCAAA AATCCGCCTA AACGCTCGAT TCTGCTCGTT 
GCGCTGACGG GCGAGGAAGT GGGCTTGCTA GGCAGTAAAT ACTACGCGTC ACATCCGATC 
ATGCCTCTGA ACAAATGCAT TTTCAATATG AATTCCGATG GTGCAGGCTA TAACGACACC 
ACCATCGTAT CGGTAATGGG CCTCGACCGC ACCGGCGCGC GCGCGGAGCT CGAGGCGGCT 
TGTAAGGCAT TCGGCCTGGG CATTTTCGCC GACCCATCAC CGGAACAGGG GCTTTTCGAC 
CGTTCGGATA ATGTGAGTTT TGCCAGAGAA GGCATCCCCG CACCCACGTT CACACCCGGT 
TTTAAAGAAT TTAACGGGGA TATTATGAAA AATTACCATC AGGTAACCGA CAACCCCGAG 
ACAATCGACT TCAACTACCT GTTGAAATTC AGCCAGGCCT ACACCTACGC CACCAGGCTC 
ATCGCCGACC GCAAAACAGC CCCGCAATGG AGCCCCGGCG ACAAGTACGA GCCCGCCGCG 
AAGAAGCTGT ATGGAAAATA G

Protein sequence

MKLSLLLLPL GLALTLPAEA QKKTQSLPEF QVKKSETEAH IRFLAGDELM GRRTGEQGNF 
VAARYIAEQF RKMGVVPAPG NTETGTSSYF QRVPFEKMGA NGTGEIAADA EIMKSGTDWI 
LMAGEAVELK APIIYASYGL ENAAKSWDDY KGLDVKGKIV LVESGTPENQ TPSEIFATSA 
EKRTIAIDKG AIAVIELFNA PIPWNVVSKF FAGEKISLAE GTASQSIPHA WVNGKEAKFA 
RALRAVKEVT FKTSGRVAKP IYSYNVAGYI PGTDPKLKEE YVLLSAHYDH VGVGKQGGQT 
YTPEDSIFNG ARDNAFGVTA LLTAAEALAK NPPKRSILLV ALTGEEVGLL GSKYYASHPI 
MPLNKCIFNM NSDGAGYNDT TIVSVMGLDR TGARAELEAA CKAFGLGIFA DPSPEQGLFD 
RSDNVSFARE GIPAPTFTPG FKEFNGDIMK NYHQVTDNPE TIDFNYLLKF SQAYTYATRL 
IADRKTAPQW SPGDKYEPAA KKLYGK