Gene Bind_0042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_0042
Symbol
ID	6200919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	43489
End bp	44523
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	64%
IMG OID	641704038
Product	AraC family transcriptional regulator
Protein accession	YP_001831190
Protein GI	182677044
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACAGG TCGACAAGTG CAAGATCCCG CAGGCGTTCT GGCGGGCAGC TGAGCAGTTC 
GACATCCCGT CGGCCGCGCT GTTGCGGCAG GCGCGGCTGC CGGCAACGCT TCATCTGGGC 
ACACAAGTCT TCGTCACCAC GGCGCAGTAT TTCTCGCTGA TGCAGGCGAT GGCGGACCTG 
TCCGGCGACT CCGCGCTTGG CATCCGAATG GTGCAATCCG TCGATACGGC GGTCCATCCG 
CCGTCGAGCC TCGCCGCCTT CTATGCCCGC GACTATCGCG ACGGGCTGAC CCGGCTCGCA 
CGGTTCAAGC GCCTGTGCAC CCCAGAGCAG TTGCAGGTCG TCGAGGCGGG TGGCGACTGC 
ACCATCTCCA CCGAATGGCC CTTCGCCGCG GCAGCCGAAC CCAGCATATC CGTCGATATT 
ACTTTCGCCA CGTTGGTAGA ACTGGGACGG CGCGCTACCG GGCGTACCAT CGTGCCACGT 
CGGTTGGAGC TGACCCGGCC GGGACCGATA GACGCAATTC ATGCGGAATA TTTCGGCTGC 
CCGATCCGTA CCAAGGCCCC GCGGAACCTT TTGGTGCTCG ACGCCGCCGA TCTCGATCGT 
CCGTTCCCGG GACACAATCC CGAGATGCTG GAGATGCTGA CGCCGGCCCT CGGGGCGGCG 
CTCGGTGAGT TGGAGGCGCA GAGTTCGATC GCCGAACAGG TGAAGATCGT GGTGAAACGC 
AGTTTGGCGA GCGGCCAGCC CGGCCTCTCC GACGTGGCAA AGCAACTCGG CATGAGCGAT 
CGAACCCTCC AGCGGCGTAT CACCGAGGAA GGATCGACCT TTCGTGATCT GCTGTCGGAA 
GCTCGCCGGG ATCTTGGTCG CCATCTCCTG ACCGACCCCG CCACGGACAT CGATGAAGTG 
GCCTGCCTGC TCGGCTATCA GGACACCACG TCCTTCTACC GCGCTTTCCG GGAATGGGAA 
GGCATGCCGC CGAACCGCTG GCGCGAGACG AATATGAACA GGCCCCGCGC ACTTGAAACC 
GCCGGTCTCC ATTGA

Protein sequence

MAQVDKCKIP QAFWRAAEQF DIPSAALLRQ ARLPATLHLG TQVFVTTAQY FSLMQAMADL 
SGDSALGIRM VQSVDTAVHP PSSLAAFYAR DYRDGLTRLA RFKRLCTPEQ LQVVEAGGDC 
TISTEWPFAA AAEPSISVDI TFATLVELGR RATGRTIVPR RLELTRPGPI DAIHAEYFGC 
PIRTKAPRNL LVLDAADLDR PFPGHNPEML EMLTPALGAA LGELEAQSSI AEQVKIVVKR 
SLASGQPGLS DVAKQLGMSD RTLQRRITEE GSTFRDLLSE ARRDLGRHLL TDPATDIDEV 
ACLLGYQDTT SFYRAFREWE GMPPNRWRET NMNRPRALET AGLH