Gene Dshi_3854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3854
Symbol
ID	5714383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009956
Strand	-
Start bp	59311
End bp	60357
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	641276767
Product	hypothetical protein
Protein accession	YP_001542063
Protein GI	159046392
COG category	[L] Replication, recombination and repair
COG ID	[COG5534] Plasmid replication initiator protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.677421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACATCGG ATCTGAGTAT CTCCAACGCC GGGCGCGGGC TTGCGCCGGA TCGGTATCGT 
CAGGCGGATT TCTTCGTCTG CGATATCTTC GACGCGATCC CCAAGGATGA TCTCGCGACC 
ATGGAGCACC CGGTGTTCAG CCTCGCTACC CGGCCGGACA GGCGGGTGCT GTCCTATGCC 
CATAACGGGG TGGAGATCGA GGTGACCCCG AGCGTCAAGG GGCTGGCCAC GATCCACGAC 
AAGGACATCC TGATCTTCTG CATCAGCCAG CTGATGGCGG CGCTGAACGC GGGGCGCGCG 
GTGAGCCGGA CGCTCCAGAT CAAGGCCCAT GATTTGCTGG TGGCGACGAA CCGCGAGACA 
TCCGGAGACG CGTATCGGCG GCTGCGCGAG GCGTTCGAGC GGCTGGCAGG CACGCGGATC 
ACCACCAACC TGACCACCGG AGGGCAGGAG GTGACGCGCG GCTTCGGGCT GATCGAGAGC 
TGGGAGATCG TGCGCAAGGC GCGCGGCGGG CGGATGGTGA GCGTGAGCGT GACGCTGTCG 
GAATGGCTCT TCAATGCGGT GGTCAGCAAA TCGGTGCTGA CGCTGAGCCG GGATTACTTC 
CGGCTGCGCA AGCCCCTGGA GCGGCGGATC TACGAGTTGG CGCGCAAGCA TTGTGGCCGG 
CAGGCGCGCT GGGTGGTGTC GGTGGACCTG CTCTTGAAGA AGTCGGGCTC GGCCTCCCCG 
CGCCGGGTGT TTCGCAAGAT GCTGCGCGAC ATGATCGCCG CCGATCATCT GCCCGATTAC 
GAGATGGTCG AGGTGCCGGG CGACAAGATC GCGTTTGCCT TGCGCGGCGG GCTGGTGGAG 
GACGCGGGCC CCGGGTTGGG TGCGGCCCTG CCGCCCCTGC GGGCCGAGAC CCTGGAGGAG 
GCCCGGGCGC TGGCACCCGG CTGGGATGTC TACGGGCTGG AGGCGGACTG GCGCGCGTAC 
TGGGCCGGAT CGGGCCGTCC GCGCCTGCGC AGCGCCGACA AGGCGTTCCT GGGCTTCGTG 
CGGGCGCGCA TAGGGGCGGA AGGGTAG

Protein sequence

MTSDLSISNA GRGLAPDRYR QADFFVCDIF DAIPKDDLAT MEHPVFSLAT RPDRRVLSYA 
HNGVEIEVTP SVKGLATIHD KDILIFCISQ LMAALNAGRA VSRTLQIKAH DLLVATNRET 
SGDAYRRLRE AFERLAGTRI TTNLTTGGQE VTRGFGLIES WEIVRKARGG RMVSVSVTLS 
EWLFNAVVSK SVLTLSRDYF RLRKPLERRI YELARKHCGR QARWVVSVDL LLKKSGSASP 
RRVFRKMLRD MIAADHLPDY EMVEVPGDKI AFALRGGLVE DAGPGLGAAL PPLRAETLEE 
ARALAPGWDV YGLEADWRAY WAGSGRPRLR SADKAFLGFV RARIGAEG