Gene Dshi_3847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3847
Symbol
ID	5714376
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009956
Strand	+
Start bp	54662
End bp	55786
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	69%
IMG OID	641276760
Product	nuclease
Protein accession	YP_001542056
Protein GI	159046385
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.298073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGA AACGCCGCAT GTTCGACATC GAGATGCCGC CCGAAGCCGA CGCGGCCCCG 
CCGAAAACCT TCCCCGCGGG GAAGGTTTCA CATGCTGAGA CCACACCGCC CCGGCGCGGT 
CCCATGGCCG CGGCAATCAC CGAGACCTCG GATCACGCTC GCGACCGCGG CGCGCTGGAG 
GCGCAGATCC GGGCGGAAAA CGACAAGCTC GCCCATGAAT TCGTCCGCCT GAAGAAGGCC 
GGGCAGATCG TCGACCGCAT CCCGCTGGAC CAGATCGAAA CCTACAAGCT GGCCCGCGAC 
CGCCTGCCGG GGCTAGACCC GGAGCTTGAC GAGCTGATCG CCTCGATCCG CGACCTGGGC 
CTGTCGAACC CGATCCGGGT CGAGCCGCGG GAGGATGGCC GCTACGAACT GATCCAGGGC 
TACCGCCGGG TGCAGGCCTA TCGCCGGCTG CTGGACGAGA CCGGCGATGC CGAGACCTGG 
GGCGCGATCC CGGCGGGGAT CGAGGCCCGC GGCGCGGCGC TGGAAGCGCT CTATCGCCGG 
ATGGTGGACG AGAACATGGT GCGCAAGGAC ATCTCCTTTG CCGAGATGGC CCAGCTGGCC 
CTGAACTACG CCGCCGACCC GCATACCGCC GAGAACGATC CCAACCGCGC GGTGGCGGAA 
CTGTTCCAGT CGGCCAACTA CTCCAAGCGC AGCTATATCC GTGCCTTCAT CCGCGTGATG 
CGGGAGCTGG GCGAGGACCT GCAATTTCCC ACCGAGATCC CGCGCGCGCT CGGCACGACC 
CTGGCCGCGC GCATGGACGA GATGGAGGGG ATCCCCCACG CGATCCGCGA AGAGCTCAAG 
ACCTGGGAGA ACCGCTCCGT CGTCGAGGAG CTGGCCGTGC TGCGGCGTTT TGCGGGGGGC 
GAGATCCCCG AGGATGCACC GCGGCCCGCG CCCAAGCCCG CGGTCCCGGC AACCCCCGGC 
GGCACCAAGG CCAAGACCAC CTTCCAGATG GAGCGCCCCC AGGGCCGGGC GAAATGCACC 
GCGGCCAACG GGCGGCTGGA GATCCGGTTG GAGAGGGATT TCTCGGCGCT GGAGCGGCGC 
AAGCTGGAGC AGGCCGTGCG CCTGTTTCTG GACCAGCTCG ACTGA

Protein sequence

MSKKRRMFDI EMPPEADAAP PKTFPAGKVS HAETTPPRRG PMAAAITETS DHARDRGALE 
AQIRAENDKL AHEFVRLKKA GQIVDRIPLD QIETYKLARD RLPGLDPELD ELIASIRDLG 
LSNPIRVEPR EDGRYELIQG YRRVQAYRRL LDETGDAETW GAIPAGIEAR GAALEALYRR 
MVDENMVRKD ISFAEMAQLA LNYAADPHTA ENDPNRAVAE LFQSANYSKR SYIRAFIRVM 
RELGEDLQFP TEIPRALGTT LAARMDEMEG IPHAIREELK TWENRSVVEE LAVLRRFAGG 
EIPEDAPRPA PKPAVPATPG GTKAKTTFQM ERPQGRAKCT AANGRLEIRL ERDFSALERR 
KLEQAVRLFL DQLD