Gene Bind_1720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1720
Symbol
ID	6199692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	1944057
End bp	1945052
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	61%
IMG OID	641705711
Product	DeoR family transcriptional regulator
Protein accession	YP_001832839
Protein GI	182678693
COG category	[K] Transcription
COG ID	[COG2390] Transcriptional regulator, contains sigma factor-related N-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.925466
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0186791
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAAAC GGTTGAGTGA GCGCGGGCAG AATATCGAGC AGAAGCACCA GGACCAGAAA 
CGTTTCGATC TCGCGGCGCG GGCGGCTTGG CTCGCTTATG CGCTTGGCCG GACTCAGGAT 
GAAATCGCGG CGGAATTGAA TGTTTCGCGC CAGAACGCGC AGCGTCTCAT CGCGCTCGCC 
AGCGCGGCCG GCCTCGTCAA ATTCCGCCTC GATCATCCGC TCGCCGATTG CATCGCCAAA 
GCGCAGAAAC TGCGGGATAA ATTCAGCCTC AAACATGTCG AGGTCGTCCC CTCGGCGCAA 
AGCGATGAGG ACAATAGGCT TTCCGTGGGG ATCGCCGTGG CCTCCTATAT CGAGACTCTT 
CTCTCGCAGA CGGAGCCGCA GATTCTGTGT CTTGGTACCG GCCGCACCTT ACGCTCGGCC 
GTGCATCAAA TGCCCCTGAT GGAAAAGCCG AAGCACAAGA TCGTATCCCT CATCGGCACG 
GTGGGACCCG ATGGTCGCGC AAGTCCCTAT GATGTCGTCA TGCGGCTTGC CGACCGTGTT 
GGGGCACAAT GCTACCCCCT GCCCATGCCG GTCCTGGCCG ATGGCCCTGA AGAACGACGC 
ATGCTCCAGT CCCAGAAGGG TTTGCGCGCC CTTCATGATC TCGCCGAAGA GGCACGGACA 
TGGATCGTGG GCGTCGGCGA CCTTGGATCC CAAGCCTCCC TGCATGTCGA TGGATTTATC 
ACAGACGAGG AACTTGCCGA ATTGCAGGCC AAGGGCGCGG TTGGAGAAAT TCTCGGCTGG 
GCTTTCGATG GGCAAGGTGG ACCGGTCAAG ACCTCGATCC ATGACAGGCT GATCGCCGTG 
GGGCTTGCCA CGCCCATCGC CTCGCACCGA ACGATTATCG CGGCGAGCGT CGGCGCGCAT 
AAGATCGCCC CCTTGCTCGG CGCGCTCCGA GGCGGGTTGG TCAATGGCGT GCTCACGGAT 
GAGAGGACGG CGCAAACCTT GATCGAAGCG CCTTGA

Protein sequence

MQKRLSERGQ NIEQKHQDQK RFDLAARAAW LAYALGRTQD EIAAELNVSR QNAQRLIALA 
SAAGLVKFRL DHPLADCIAK AQKLRDKFSL KHVEVVPSAQ SDEDNRLSVG IAVASYIETL 
LSQTEPQILC LGTGRTLRSA VHQMPLMEKP KHKIVSLIGT VGPDGRASPY DVVMRLADRV 
GAQCYPLPMP VLADGPEERR MLQSQKGLRA LHDLAEEART WIVGVGDLGS QASLHVDGFI 
TDEELAELQA KGAVGEILGW AFDGQGGPVK TSIHDRLIAV GLATPIASHR TIIAASVGAH 
KIAPLLGALR GGLVNGVLTD ERTAQTLIEA P