Gene Smed_1433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1433
Symbol
ID	5322285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1514091
End bp	1515116
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	62%
IMG OID	640790376
Product	AraC family transcriptional regulator
Protein accession	YP_001327114
Protein GI	150396647
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00000646594
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCATGG TTGCGAACAG GATTGCACAA TCTACGATCG AGGTCGCGGT GATTATCCTG 
CCCGAGTCGT CGATCATGTC CCTTGCTTCC GTCCTCGATC CGATGCGCGC GGCAAACCGG 
GTGACCGGGC ACGAGGTCTT CCGGTGGCGG TTGCTCTCGG CCGATGGTGA CGCGGTGATG 
CTCACCTGCG GCTTATCTAT TCCGGTGGAT GCTCGGTTCG CCCTGCCGAT CGTCGGGGAT 
CTCCTTCTCA TCATCGGCGG GTTCAATCTC GAGAGATATG CAGGCAAGCG CTTCCTCGCT 
ACTCTGCAGG AATGCGCGCG GCATTTCGAT ATCGTCGCGG GCGTTGAGTC CGGGTGTTGG 
CTGCTCGGGC GTTCCGGGCT TATCAAAGGC CGCAAGGCAA CCGCCCACTG GGAGGAGCTC 
GAGGATTTCA GTCGGGCATT TCCCGAGCTG CAGGTGATTG GGGACCGTTT CGTGACCGAC 
GGCAAGTACT GGACCTCCGG TGGCGCGTCG CCGACTTTCG ACATGATGCT GCACCTCATT 
GCGGAGAGGC TGGGGCCGGC TATCGCGCTG GATGTAGCGA GCATTTTTGT CTACGATCAG 
ATGCACAGTC CCACGGACGT ACAGCCCTTC GTCTCGCTCG GCCGCATGGA AGCACGAGAT 
CCGGAGCTCG CCGCGGCCAT AAGGCTGATG GAGCGCACAC TCGAACGGCC GATGACGGTC 
GCGGCGCTTG CGCGCCGGCT ATCCGTCTCA CAACGCAAGC TTGAAATGCT CTTCGCCAAA 
GGCCTCTCGA CCAGCCCGGG CGCCTATTAC CTGCGCCTCA GGCTGCAGGT CTCCCACCGG 
CTCGTTCGCG ATACCGGAAT TCCAATGCGG GATGTCGCCC TTCGCTGCGG GTTTGACAGT 
CTCTCGGCCT TTTCGCGTGC CTACCGACGC GAATACGGGA CGAGCCCTAC GGGTATGCGC 
AGCGCACGCA GCGCAAGCGT CGCTTCTGAG ATGTCAGATG AAGGCGGACG CCACGCGCGC 
CCCTGA

Protein sequence

MRMVANRIAQ STIEVAVIIL PESSIMSLAS VLDPMRAANR VTGHEVFRWR LLSADGDAVM 
LTCGLSIPVD ARFALPIVGD LLLIIGGFNL ERYAGKRFLA TLQECARHFD IVAGVESGCW 
LLGRSGLIKG RKATAHWEEL EDFSRAFPEL QVIGDRFVTD GKYWTSGGAS PTFDMMLHLI 
AERLGPAIAL DVASIFVYDQ MHSPTDVQPF VSLGRMEARD PELAAAIRLM ERTLERPMTV 
AALARRLSVS QRKLEMLFAK GLSTSPGAYY LRLRLQVSHR LVRDTGIPMR DVALRCGFDS 
LSAFSRAYRR EYGTSPTGMR SARSASVASE MSDEGGRHAR P