Gene Dfer_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dfer_1039
Symbol
ID	8224609
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dyadobacter fermentans DSM 18053
Kingdom	Bacteria
Replicon accession	NC_013037
Strand	-
Start bp	1225806
End bp	1227233
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	55%
IMG OID	644928900
Product	protein of unknown function DUF1501
Protein accession	YP_003085453
Protein GI	255034832
COG category
COG ID
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.214334
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.240283
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATCC AATGGAGTAG GAGAGAGTTC TTGCAACGCG CCAGCGCGGC CACGATGGCT 
GCATTGGCAG CGGGAGCTCC CGTATCAAAC CTGCTAACCT CGTGCCGGGG TAAAGCGGGA 
GCCGATTCGA CGGCGGACAC GGTGATACTA TTATGGATGG CGGGCGGTAT GGCGCACACC 
GAAACTTTCG ACCCCAAAGC CTATACGCCA TTCGAAAAAG ACATGGAAGG AAACCGTGTT 
TTGAGCACAT TCAAATCGCT TCCTACCAAG CTCGACGGCA TCCATTTTTC GGAAGGCCTG 
CAATCGATAG GGCAAGTGAT GGACAAGGGA ACACTCATCC GCTCTTACGT GGCGGCCGAC 
ATGGGACATA TCCTGCATTC GCGGCACCAG TACCACTGGC ATACCTGCTA CGAGCCGCCA 
CAAACGGTGG CCGCACCGCA TATGGGTTCG TGGATTGCAA AGGAGCTGGG ACCCAAAAAT 
CCGGTAATCC CCGCATTCGT GGACATCGGT CAGCGCTTCA CGGTAGGCGA GGCCGAAGAG 
TTGAAAGCAT TCCATACGGC GGGCTTCCTC GGCAACGAGT TCGGACCGTT CTTTATCCCC 
GACCCGAGCC AGGGCCTCGA AAGCGTGCGT CCACCCGTGG GCATGGATGC GAAGCGTTTT 
GAACGTAGAA ACCAGCTGTA CAACGAGCTG ATCAATAACA GCCCGGTGGG GGAATTTGGC 
AGCGACTACC AGCGCGAATC CCTCAAACGC TCCATGGAGC AGGCTTATGC ATTGCTCAAT 
TCGCCGGAAT CCAAAGCATT CGACCTCAGC ACCGAACCTA AGAAAAGCTA CGACATTTAT 
AACACCGGCC GCTTCGGGCT CGGTTGCCTG CTCGCACGCC GCCTGACCGA ACAAGGTGCC 
CGGTTCATCA GCGTGACCAC CGAATATGAG CCGTTCAAAG GCTGGGACAC GCACGAAAAT 
GGTCATACGC GTTTGCAGGA AATGAAAAAG CAGATCGACG GTCCGGTGGC CCAGCTTATT 
AAAGACCTCG ATGAAAAAGG CCTGCTCGAC CGCACTATGG TTGTCCTCGC GAGCGAATTC 
AGCCGTGATA TGATGGTGGA AGGTCGCCCG GATGCGAAAG TGAAGGAACA GGTAGCGCAG 
CCGGACATCC TTTCGGACCT CAAATTCTAC GGCATGCACC GCCATTTCAC CGACGGCTGT 
TCCATGCTCA TGTTCGGTGG CGGCATTAAA AAGGGCTTTG TATACGGCAA AACCGCCGAC 
GAACGCCCAT GCAAAACGAT TGAGAACCCG ATCAAGATCG AAGGCGTTCA CCAAACCATC 
TACCACGCGC TCGGCATTCC GCCGGACACG CAATATGAAA TCGAAAAGCG GCCGTTCTAC 
ACGACACCGG ATGGTAAGGG GCTGGCGGTG AAGGAATTGT TGATATAG

Protein sequence

MNIQWSRREF LQRASAATMA ALAAGAPVSN LLTSCRGKAG ADSTADTVIL LWMAGGMAHT 
ETFDPKAYTP FEKDMEGNRV LSTFKSLPTK LDGIHFSEGL QSIGQVMDKG TLIRSYVAAD 
MGHILHSRHQ YHWHTCYEPP QTVAAPHMGS WIAKELGPKN PVIPAFVDIG QRFTVGEAEE 
LKAFHTAGFL GNEFGPFFIP DPSQGLESVR PPVGMDAKRF ERRNQLYNEL INNSPVGEFG 
SDYQRESLKR SMEQAYALLN SPESKAFDLS TEPKKSYDIY NTGRFGLGCL LARRLTEQGA 
RFISVTTEYE PFKGWDTHEN GHTRLQEMKK QIDGPVAQLI KDLDEKGLLD RTMVVLASEF 
SRDMMVEGRP DAKVKEQVAQ PDILSDLKFY GMHRHFTDGC SMLMFGGGIK KGFVYGKTAD 
ERPCKTIENP IKIEGVHQTI YHALGIPPDT QYEIEKRPFY TTPDGKGLAV KELLI