Gene Dshi_1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1840
Symbol
ID	5712832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	1921699
End bp	1922916
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	70%
IMG OID	641267764
Product	hypothetical protein
Protein accession	YP_001533183
Protein GI	159044389
COG category	[E] Amino acid transport and metabolism [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases [COG1765] Predicted redox protein, regulator of disulfide bond formation
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.949047
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTACCG AAAAGCTGAC CTTCACCGGC CATTCCGGCG ACACCCTTGC CGCGCGTCTC 
GACCTGCCCG AGGGCCCGCA CCTGGCCACC GCGCTCTTTG CCCATTGCTT CACCTGCTCC 
AAGGACATCC CCGCCGCGCG CCGGATCGCG CAGCGGCTCG CGGCCATGGG GATCGCGGTT 
TTGCGGTTCG ATTTCACCGG GCTGGGGCAT TCGGGGGGCG AGTTCAGGAA CACCACGTTT 
TCGTCCAACG TCGCCGACCT GCGGCTGGCG GCGGAGGCGC TGGCGGCCCG CGGCATGGCG 
CCCAGCCTGT TGATCGGGCA CAGCCTGGGC GGGGCGGCGG TGCTGAAGGC GGTGCGCAGC 
ATTCCGGGGG TCAAGGCGGT GGCGACGATC GGCGCGCCCT TCGATCCCGG GCATGTCACC 
CATAATTTCG CCGAGGCGCT GGAGACGATC GCGGCGCAGG GCGAGGCCGA GGTGCAGCTG 
GGCGGGCGGC CCTTCCGGAT CCGCAAGGCG TTCGTCGAGG ATGTGACGGC CGAGAAACTG 
GCCCCCGAGA TCGCCGCGAT GAAGGCCGCC CTTCTGGTGC TGCACGCGCC GCTGGACGCG 
CAGGTGGGGA TCGAGAACGC CACGCAGATC TTCGCGGCCG CGAAACATCC CAAGAGCTTC 
GTCACCCTCG ACGATGCGGA CCACCTGATC ACCCGCGCTG CGGATGCGGA TTACGCCGCC 
GAAGTGATCG CCGCTTGGGT CGGGCGATAC CTGGACCTGC GCCCGCCCGC CCCGCCCCCG 
GGCGTGCCCG AGGGGATCAC CCGGGTGTCG GAGGCCGATC CCGCCGGGTT CCTGCAGGAC 
GTGAGCGCGG GCCCCTCCCA TCACATCCAG GCCGATGAGC CGCTGGCCTA TGGCGGCACC 
AATCGCGGGC TGACACCCTA CCAGTTGCTG GCCGCCGGGC TGGGCGCCTG CACCTCGATG 
ACCCTGCGGA TGTATGCCCG CCAGAAGGGC TGGCCCCTAA CCCATGTCTC GGTCGACGTG 
ATGCACGACA AGGTGCACGG CCAGGACGCC AAGGGCGCTC ATGACCGCAT CGACAGTTTC 
GTGCGCCGCA TCCACCTGGA GGGCGATCTG GACACGGCGC AGCAGGAGCG GCTGCTGGAG 
ATCGCGGACA AGTGCCCGGT GCATCGCACG CTCGAGACCG GCGCACGCAT CGTCACCGAA 
CTGGCCGTGC CCGCCTGA

Protein sequence

MPTEKLTFTG HSGDTLAARL DLPEGPHLAT ALFAHCFTCS KDIPAARRIA QRLAAMGIAV 
LRFDFTGLGH SGGEFRNTTF SSNVADLRLA AEALAARGMA PSLLIGHSLG GAAVLKAVRS 
IPGVKAVATI GAPFDPGHVT HNFAEALETI AAQGEAEVQL GGRPFRIRKA FVEDVTAEKL 
APEIAAMKAA LLVLHAPLDA QVGIENATQI FAAAKHPKSF VTLDDADHLI TRAADADYAA 
EVIAAWVGRY LDLRPPAPPP GVPEGITRVS EADPAGFLQD VSAGPSHHIQ ADEPLAYGGT 
NRGLTPYQLL AAGLGACTSM TLRMYARQKG WPLTHVSVDV MHDKVHGQDA KGAHDRIDSF 
VRRIHLEGDL DTAQQERLLE IADKCPVHRT LETGARIVTE LAVPA