Gene Dshi_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2044
Symbol
ID	5713039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	2162631
End bp	2164097
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	67%
IMG OID	641267967
Product	HTH-type transcriptional regulator
Protein accession	YP_001533383
Protein GI	159044589
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.411969
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATCA GACCCGAGTC CCTCATCTTC GATCAGGACG GCGAAGGCAC CCGCCAGCAC 
CGCATCAAGC GGCAGGTGAT CGACGGTATC CTCAGCGGCC GGTTCAAGCC GGGGGACAAG 
ATGCCCTCCA GCCGTGGCCT CGCCCGCCAG CTCGGCGTCA GCCGGATCAC CGTGACCATC 
GCCTACACCG ACCTCGTGGC CGACGACTAC CTCGTGGCGC GCGGGCGATC CGGGTACTTC 
GTCTCCGACA GCGCCCCCAG CGCGCCCAGC CTGGTGCAGG CCTGCCAGAA CGGCGAGAGC 
ATCGTGGACT GGACGCGCCT GATGTCCCAC CGGGAACCGC CGCCCGAGGA GATCGCCCGC 
CCCTTCGACT GGCACAGCTT CCCCTACCCG TTCATCTACG GACAGACGGA TCCCCAGCTT 
TTCGATCATC GTAATTGGCG GCTCTGCGCG CTCGAGGCGC TCGGCCTGCG GGAATTCGAG 
AGCCTGACCG CCGACCATTA TGAGCGGGAC GATCCGAAAC TCGTGGAGTA TATCCAACGC 
AACATCCTGC CCCGGCGGGG GATCGCGGCG CGCCCCAACC AGATCCTGAT CACCATGGGC 
GCGCAGAACG CGCTCTGGCT CTGTGCGCAA CTTCTGCTCA CCCAGCGGCG CAAGGCGGTG 
CTGGAGAACC CCGGCTACCC CAGCCTGCGC CAGATCCTCG GCGCCACACG CTGCCATACC 
CAAAGCGTCG ATGTGGACGC AGACGGTCTG GCCCCCGAAA CGCTGCCCGA CGCGCTCGAC 
GTGCTCTTCA CCACCGTCAG CCACCAATGC CCCACCAACG CCACCATGCC ACTGGCCCGG 
CGCAAGGCGC TGCTGTCCCT GGCCGCCGAA CGCGGCTTCG TGGTGGTGGA GGACGAGTAC 
GAGTTCGAGC TGGCTTTCGG GCGCACTGCA ACACCGTCGC TCAAGTCGTT CGACACGCAT 
GGCACGGTGA TCTATGTCGG CTCGTTCTCG AAGTCCCTGT TTCCGGGGCT TCGGCTGGGT 
TTCATGGTCG CCCCGCACCC CTTCATCGCC GAGGCCCGCC GGTTGCGCGG CACCGTGCTC 
CGCCATCCGC CGGGATTGAT TCAGCGGACC ACGGCGAACT TCCTGTCGCG CGGGCATTTC 
GATGCGCAGA TCAACCGGAT GCGCAAGGCC TACGAGGTGC GCCGCCGCGC CATGGAAACG 
GCGATCGCCG AGACCGGGCT GCAAGTCGCC TCCCAACCCG CCAATGGCGG ATCGAGCCTG 
TGGATGCGGG CGCCGGACGG CGTGGATACC GACCTGCTGG CCCGGCGGCT CCGGTCCAAG 
GGGGTGGTGA TCGAACCGGG CGCGGCCTTC TTCGACCCCA CCCGCCCTCA GCGCAACTTT 
TACCGGCTCG CCTATTCGTC GATCGAGGTG GCCCGCATTC CCCAGGGCAT TCGGCTGATC 
GCCGCTGCGC TGGCCGATCT GGACTGA

Protein sequence

MDIRPESLIF DQDGEGTRQH RIKRQVIDGI LSGRFKPGDK MPSSRGLARQ LGVSRITVTI 
AYTDLVADDY LVARGRSGYF VSDSAPSAPS LVQACQNGES IVDWTRLMSH REPPPEEIAR 
PFDWHSFPYP FIYGQTDPQL FDHRNWRLCA LEALGLREFE SLTADHYERD DPKLVEYIQR 
NILPRRGIAA RPNQILITMG AQNALWLCAQ LLLTQRRKAV LENPGYPSLR QILGATRCHT 
QSVDVDADGL APETLPDALD VLFTTVSHQC PTNATMPLAR RKALLSLAAE RGFVVVEDEY 
EFELAFGRTA TPSLKSFDTH GTVIYVGSFS KSLFPGLRLG FMVAPHPFIA EARRLRGTVL 
RHPPGLIQRT TANFLSRGHF DAQINRMRKA YEVRRRAMET AIAETGLQVA SQPANGGSSL 
WMRAPDGVDT DLLARRLRSK GVVIEPGAAF FDPTRPQRNF YRLAYSSIEV ARIPQGIRLI 
AAALADLD