Gene Smed_3775 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3775
Symbol
ID	5318223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	223134
End bp	224090
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	61%
IMG OID	640775588
Product	AraC-like transcriptional regulator
Protein accession	YP_001312521
Protein GI	150375925
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.795213
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA TCATGTTCCC GCAGCGGAAT CTGCGCGAAG AAACGGCGCC GCTCCGCGCG 
CAGATTCTCG ACAGATTGTC GAAGTTGCCC TGGGACGGAC TTTCTTTCGA GCACCCCATC 
CCGGGTCTCT CGCTCTATCG CATCATCCAG CCCGCCGGTC CCTTTTCGAG CGTTTACGAG 
CCAAGCCTCT CCTTCATCAT CAAGGGAAGC AAGAATGTCC GCGTCGGCAA CGAGACGATG 
GTCTACGATG AAGGCTGTTT CTTCCTGACG GCTATCGGCC TGCCCGTGAC CGGGCAGATC 
TGCGCGGCGA GCGAAAGGGA GCCCTATGTC GCAGCGGCGC TACGCCTGGA CATGGAGAAA 
GTCCGGCGCA TCATAGCCGA TCACGACATA CATCCGACCG ACCTTCCCGA GCGCGACCTG 
GGCGTGGCTG TAGGCACTGC GACTTGCGAG CTTTTCGATG CGCTGTTCCG GCTGATCTCG 
CTTGCCGGCG CGCCCGCAGA CATACCTTTC CTGGCTGGCC ACATCCAGAA CGAGATCATC 
TACCGGCTCC TCACCGGCGA ACAGGGAGCG AGGCTTCGTC GCTTCGCGCT TGCGGGCACG 
AACAGCAATC GCGTGGCCAA GGCGGTCGCA TGGCTGAAGG AAAACTACAC CAAACAGCTG 
CGCGTGGAAG AACTCGCCGA AATCGCCAAT ATGGGCGTCT CCACGCTGCA TCATCACTTC 
CGCGCAATGA CTGCAATGAG CCCGCTGCAG TTTCAAAAGC ACCTCAGACT GCATCATGCC 
CGGGAACTGA TGCTTTCCCA GTCGCTCGAT GCGGCGACGG CGGCACTGCG CGTCGGCTAC 
GAGAGCCCGA CCCAGTTCAA CCGCGAGTAC CGCCGCGCCT TCGGCCATCC GCCGCTGCGC 
GACATAAGGG CGATCCTGAA TTCTAACGAT TCGACCAGGC GGAGCCCTGC AGGTTAG

Protein sequence

MSTIMFPQRN LREETAPLRA QILDRLSKLP WDGLSFEHPI PGLSLYRIIQ PAGPFSSVYE 
PSLSFIIKGS KNVRVGNETM VYDEGCFFLT AIGLPVTGQI CAASEREPYV AAALRLDMEK 
VRRIIADHDI HPTDLPERDL GVAVGTATCE LFDALFRLIS LAGAPADIPF LAGHIQNEII 
YRLLTGEQGA RLRRFALAGT NSNRVAKAVA WLKENYTKQL RVEELAEIAN MGVSTLHHHF 
RAMTAMSPLQ FQKHLRLHHA RELMLSQSLD AATAALRVGY ESPTQFNREY RRAFGHPPLR 
DIRAILNSND STRRSPAG