Gene Bind_1991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1991
Symbol
ID	6201182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	2275663
End bp	2276790
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	55%
IMG OID	641705979
Product	LuxR family transcriptional regulator
Protein accession	YP_001833103
Protein GI	182678957
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00358246
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGATTGATC CCGTCGTCGA AAATTTGATC CGCGCCATCT ATGATTGCGT CATCGATCCA 
TCGGGTTGGG AAGACGTCCT GCAAAGGATC GTCACCCATA CCCATGGCGT TGCCGCCGCT 
TTGGAAGCGG AGATGTCAGA GACAAAGCCT AAGAAGATCG CAAGCTATAA TTTCGATCCT 
TTTTATGACT TTGCTTATCG AAGCCATTTT CATGCCTTGA ATCCGTTCAT CCCTGGCCGA 
TTGTCCCAAA TGGCCGAAAC CGTTTCTATT GGCAATTCCA TAACCGATAC CGCTGCTTAT 
CGTGCGTCAT CCTTTTATAA TGAATTCGCC AAGCCCCAGG GATGGGAAGC CTTTATCAGT 
GTGAATCTCA ATGGACCTGG GGGCGCCGAT GTCTTCGCCC TCATGCGAAG CCAAAAAACC 
GATTTCGCTC AGACGGGCAT CGAACATTTT CTGACTCTTC TCGCGCCGCA TTTGCGGCGT 
GCCTATGATC TTTCCAGCCT CCTGGCCCAT AGTCGTCAGA CGGCGGAGTT TCTAGGGCGG 
GCGATTGCCA CTGCGGGGTT CGGCACTATT CTCCTGAGCG AAAAATGCCG GATCGTCTAT 
GCCAATGAGG TTGCCGAGGA GCTGCTTCGT CAGCAACAGG GGCTGGCTTT CATTCGAGGT 
GAACTCGTCG CGGAGGCAAC GACCCTGACC TCCCGACTTG CGGCCATGGT GCGCGCCTGT 
GTCGACCCGC GGGCCTTGAC CGATCCGCTC ACCACAATGC TCGAGCTCCC GCGCCGCGGT 
TCGGATCAGC CCATCCGCGT GCATGTCTTG CCCCTTCAGG AAAAGACGGC GGCGATGGTG 
GCCCATCGGG CACGGCCCGT TGCCGCGCTT TTCCTGGTCA ATCCGCAGCA TGATCTTTCC 
ACTCGGATGC AAAGTTTTGC CGATGCTTAT TCCTTAACGT CGATCGAGAT CGCAATCCTG 
GGGGAACTCA TTCACAGTGA GTCGCTGACA TTGGTCGCTG CGAAGCTTGG CGTGTCTGCC 
TCGACCTTGC GGACGCATAT GGGACGCTTG ATGGCCAAGA CCGGGACAAG AAATCGACTT 
GAACTTCTCC GCAGCTTCTT CGAAATGTTC TGCTTCGCTT CGCGGTAA

Protein sequence

MIDPVVENLI RAIYDCVIDP SGWEDVLQRI VTHTHGVAAA LEAEMSETKP KKIASYNFDP 
FYDFAYRSHF HALNPFIPGR LSQMAETVSI GNSITDTAAY RASSFYNEFA KPQGWEAFIS 
VNLNGPGGAD VFALMRSQKT DFAQTGIEHF LTLLAPHLRR AYDLSSLLAH SRQTAEFLGR 
AIATAGFGTI LLSEKCRIVY ANEVAEELLR QQQGLAFIRG ELVAEATTLT SRLAAMVRAC 
VDPRALTDPL TTMLELPRRG SDQPIRVHVL PLQEKTAAMV AHRARPVAAL FLVNPQHDLS 
TRMQSFADAY SLTSIEIAIL GELIHSESLT LVAAKLGVSA STLRTHMGRL MAKTGTRNRL 
ELLRSFFEMF CFASR