Gene Dshi_4021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_4021
Symbol
ID	5714550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009957
Strand	-
Start bp	87675
End bp	88910
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	57%
IMG OID	641276933
Product	replication initiation protein RepC
Protein accession	YP_001542229
Protein GI	159046559
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0836066
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACTACA CGCCCGTAAC GCCGTTCCGG CGAACGATAG ATGCTGCCAT CCTGAAACAT 
CAGGCAGCGA CCCAAGAAGA CCTGCCCCCA GCCGGCGCCA ACAAGTGGGA GGTCCTGAGG 
GAGCTCGCTG CCGCTCGAGT CGCGTTCGGC TTGTCCGATC GGGATTTGAC GGTGCTTCAG 
GCGCTGGTCA GCTTTCACCA AGCGACAATT CTCGGAGGCA ATGACAGCGA ATTGATTGTA 
CATCCGTCCA ACAAGGCGAT TTGCGAGCGC CTGAACGGCA TGCCCTGCTC GACGATGCGG 
CGCCACCTCT CCAACCTTGT GCAGACTGGC TTTGTTGTCC GGCGCGATAG CCCCAATGGG 
AAGCGCTATG CCCGCCGCTA CGGCGACGAA AAGGTTGCGT TTGGGTTCGA CCTCTCTCCG 
CTCGTTCGAC GCTTCCAGGA AGTTTGTGAG GCTGCTGAGA CCGTCCGGGC CGCAGAAGAG 
CGGTACAAGC GCCTACGTGC CACTGTGAGC CTCATGCGGC GTGACCTCGC AGGGCTGGCC 
GAGTACGGGC GCTCACTTCG TCCGGATCAG GGCGTCTGGG ACCAATTCTC TGATCTTGCG 
GCCCTAATGG CCCGAGATCT TCGCAGAAAA CTCGAAATGG AAGACCTTAG GCGCATCGAA 
GACGCTTTGG GGTCAGCTTT AGATCACGCC CGAAGCCTTC TGGATGGCTG TGAAACAGAA 
AATATGAGCA CCAATGATGC TGTTTCTGAG CAGCATTATC AGAATTCAAA TAAAGACTCT 
TATGATCTTG AACCTCGCTT AGAAAAAGCG CGGGGCGGAG GCGCTGTGCG CGAAACTCCA 
GAAGTTGCCA ATAGTCATCT GTGTTCTGAA GATGAGGGCA ACTCAACGGC AACTATTGAC 
GATCAACTGA TGCCGAACAT ACCGCTTGGT CTCGTCCTCG CTTCCTGTCA GGAATTCAAA 
GCGTATTCCG AGCAGCCCGT GCGCCACTGG CACGATCTGG TCCGGGTGGC TGATGTGGTC 
AGGCCCATGA TGGGTATTTC CCCGTCCGCG TGGGACGAGG CGAAACGCTA TATGGGTCCC 
GAAGAAGCGT CTGTTGTGAT CGTTGCAATG CTTGAACGGT TTGCGGATAT CCGATCACCT 
GGAGGCTACT TGAGAACCCT ATCTTCAAAG GCAGCAATTG GGGAGTTCTC CTGCGGTCCG 
ATGATCATGG CCTTGATGCG GCGGGATGCT GCATGA

Protein sequence

MDYTPVTPFR RTIDAAILKH QAATQEDLPP AGANKWEVLR ELAAARVAFG LSDRDLTVLQ 
ALVSFHQATI LGGNDSELIV HPSNKAICER LNGMPCSTMR RHLSNLVQTG FVVRRDSPNG 
KRYARRYGDE KVAFGFDLSP LVRRFQEVCE AAETVRAAEE RYKRLRATVS LMRRDLAGLA 
EYGRSLRPDQ GVWDQFSDLA ALMARDLRRK LEMEDLRRIE DALGSALDHA RSLLDGCETE 
NMSTNDAVSE QHYQNSNKDS YDLEPRLEKA RGGGAVRETP EVANSHLCSE DEGNSTATID 
DQLMPNIPLG LVLASCQEFK AYSEQPVRHW HDLVRVADVV RPMMGISPSA WDEAKRYMGP 
EEASVVIVAM LERFADIRSP GGYLRTLSSK AAIGEFSCGP MIMALMRRDA A