Gene Dshi_2050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2050
Symbol
ID	5713045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	2170309
End bp	2171463
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	67%
IMG OID	641267972
Product	hypothetical protein
Protein accession	YP_001533388
Protein GI	159044594
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0767] ABC-type transport system involved in resistance to organic solvents, permease component
TIGRFAM ID	[TIGR00056] conserved hypothetical integral membrane protein

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.449343
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGCAA CGGATGCCGC AGAATATGCA GAAGGACGCG GGGTCGATGC GCGCCCCGCG 
CCCGACTTGC GCTTGTCGCA GGATGAAGCC GGGGTCGCAG GCGCGCTGAG TGGCGATCTG 
ACGATCTACG GGGTGGCCGA TCTGCAGCGG CAGCTTGCCG CGCGCCCGGC CGGGTCGCTG 
ACCCTGGATC TGTCCGGCAT CGGGCGGATC GATACGGCGG GCGCCTGGCT GCTGGCAGAA 
CTGGCGCGGG GCGAGGGGGT CCGCCTTGTG GGGGCGCCCG ACAAGGTGGC GCGGCTGATC 
GCCAACGTGG CCAAGGCCGA GCCCGAACAC CCGGAGCGGA CAGAGACGCC GCCGACCCTG 
ACCGATCGCT TGGAGCGGCT CGGGCGGCAG GTGGTGGAGG GGACGAAATT CCTCGGCGGG 
CTGACCGGGA TGCTGGGCCT CGTGCTGGCC CGGTTCGGTC GGGCCCTGCG GCATCCGCGG 
GAGTTCCGGA TGACCGCGCT GGTGCATCAT TGCGAGGAGG TGGGGCTCAG GGCCGTGCCC 
ATCGTGGCGC TGATGGCCTT TCTGATCGGT ATCGTTCTTG CCTTCCAGGG CGCGAGCCAG 
CTGCGGCAAT TCGGGGCCGA GGTCTTCGTC GTCGACCTGA TCTCGATCTC GATTCTGCGA 
GAGCTTGGCA TTCTGCTGAC GGCGATCATC GTGGCCGGGC GGACGGCCTC ATCGTTTACC 
GCGGCCATCG GGTCGATGAA GATGCGCGAA GAGATCGATG CGATGCGGAC GCTGGGCCTC 
GACCCCGCGA TGCTGCTGTT CCTGCCGCGG GTACTGGCGC TGCTGATCAT GTTGCCGATC 
CTGGGGCTGA TCGCCAACCT GTCGGGGTTG CTGGGCGGGG CGCTGATGTC CTGGATCGAG 
CTGGGCATCT CGCCCGCGAT GTTCCAGACC CGGCTGATCG AGGGGACCGA TATCAATCAT 
GCGGTGGTCG GGCTCGTCAA GGCGCCGTTC TTCGCCATCC TGATCGGGGT GGTTGGCTGT 
CATGCGGGGA TGCAGGTGGA GGGCAACGCC GAATCCCTTG GCCGGATGAC CTCGGGTGCG 
GTGGTGACCG CGATCTTCGC CGTGATCGTG ACCGATGCGG CGTTTTCGAT TTTCTTTGCG 
CAGATGGGGA TCTGA

Protein sequence

MAATDAAEYA EGRGVDARPA PDLRLSQDEA GVAGALSGDL TIYGVADLQR QLAARPAGSL 
TLDLSGIGRI DTAGAWLLAE LARGEGVRLV GAPDKVARLI ANVAKAEPEH PERTETPPTL 
TDRLERLGRQ VVEGTKFLGG LTGMLGLVLA RFGRALRHPR EFRMTALVHH CEEVGLRAVP 
IVALMAFLIG IVLAFQGASQ LRQFGAEVFV VDLISISILR ELGILLTAII VAGRTASSFT 
AAIGSMKMRE EIDAMRTLGL DPAMLLFLPR VLALLIMLPI LGLIANLSGL LGGALMSWIE 
LGISPAMFQT RLIEGTDINH AVVGLVKAPF FAILIGVVGC HAGMQVEGNA ESLGRMTSGA 
VVTAIFAVIV TDAAFSIFFA QMGI