Gene Smed_5885 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5885
Symbol
ID	5320187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	848915
End bp	849895
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	62%
IMG OID	640777580
Product	DeoR family transcriptional regulator
Protein accession	YP_001314512
Protein GI	150377917
COG category	[K] Transcription
COG ID	[COG2390] Transcriptional regulator, contains sigma factor-related N-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.873951
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATCC GCGTCAACGA CCAGATCATT CACAAGGCCG CCTGGCTTTA CTATACGCAC 
GGCCTTCGCC AGGACGAAGT TGCCCGGAGG CTGGAAATCT CGCGTGCTTC CATCGCCATG 
TATCTGCGGC GCGCCCGGGA GATGGGTATC GTCACGATCA CCACCTCATC GGAACTCTTC 
TCCAGTGACG TTCTCGCCCG GGAACTCGAA GACGCCACGG GACTGACGAC CGCTTGGATC 
GTCCCGGAAG ATCGGCAAGC GATGAACCCG GCTGCGGAGG TTCCGGAGGT CGCAGCCTCG 
GTCTTTCTGG AGCTGATCAA CAAGGGCGAC CGAATTGGGG TGGCATGGGG CCGCACCGTA 
TATCATATCG CCGACGTCAT GCCCTTCGCA GACCTCAAGG GCGTCACCGT CGTGCAGCTT 
TGCGGCAATC TGGGCGCACC CTATTCCTAC CGCCCCGATC AGTGCACCAC CGAAATTGCG 
CGTCGCCTCA ACGCCGAGGG CGTCAATATC TACGCACCCC TCGTTCTCTC TTCAGAGCGG 
CTTGCTGAGG AACTGCGCGC CGAGCCGGTC ATTCGGGAGC AGCTCGCAAC CATTTCCGAC 
TGCCGGCTTT CGCTCTACTC CGTCGGAGGA ATCGAGGACG ACAGCCATCT CGTCAAATGC 
GGCGCCCTTT CGGCCGACGA GATGCATGCC ATGGGCGAGA GGGGCGCGGC CGGAGTGATC 
GCCGGGCAGA TCATCGATCA CAACGGTCAA TGGATGGATT GCGCGCACAA TCGGCGCTGC 
ATCTCCGCCG ATCTCAATTC CATCCGCGCG ATCAGGAAGC GCATGCTCGT CGTGCAGGAG 
GAAAACAAGT TTGAACCCCT GTTGGCCGCT CTGAAGGGAG GCTTCGCCTC GCACCTCGTC 
GTCACCGCTT CGATGGCGCG GCGGATCATG GATCGCTGGA GCCGAGACGG GCTTGGCAGG 
AGTGCCCCTG CCAAGCCCTA G

Protein sequence

MPIRVNDQII HKAAWLYYTH GLRQDEVARR LEISRASIAM YLRRAREMGI VTITTSSELF 
SSDVLARELE DATGLTTAWI VPEDRQAMNP AAEVPEVAAS VFLELINKGD RIGVAWGRTV 
YHIADVMPFA DLKGVTVVQL CGNLGAPYSY RPDQCTTEIA RRLNAEGVNI YAPLVLSSER 
LAEELRAEPV IREQLATISD CRLSLYSVGG IEDDSHLVKC GALSADEMHA MGERGAAGVI 
AGQIIDHNGQ WMDCAHNRRC ISADLNSIRA IRKRMLVVQE ENKFEPLLAA LKGGFASHLV 
VTASMARRIM DRWSRDGLGR SAPAKP