Gene Smed_1955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1955
Symbol
ID	5322814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2006980
End bp	2008206
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	63%
IMG OID	640790893
Product	GntR family transcriptional regulator
Protein accession	YP_001327624
Protein GI	150397157
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.479896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0640255
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAACT GGGAAAGCAT TTTTGCCACG CGCTCGAACC GGATGAGAGC CTCCGAAATC 
CGTGAGTTGC TGAAGCTGCT GGATCGTCCC GAAATCATCT CGTTTGCCGG CGGTATTCCC 
GACCCGGAGC TTTTTCCGAA CGATGCGTTC AAGGAAGCGT ATGCCGAAAT CTTCGGTGGC 
CCGACCGTCG GCGCAGCACT GCAATATTCG GTAAGCGAGG GCTATCGCCC GCTTCGCGAG 
TGGCTCGCTG GTCAGATGGC GGCAATCGGC ATTCCGGCGA GCGTCGACAA TATCTTCATC 
ACCTCCGGGT CGCAGCAGGG GCTCGATTAT CTCGGCAAAC TGTTTCTGTC GCCGAAAGAT 
ACGGCGCTGG TGACCTGGCC GACCTATCTC GGTGCACTGC AGGCCTTCAA CGCCTACGAG 
CCGACCTACG ATCAGCTGAA CCCCGCCGGA AATCGCACGC CGGGGGCCTA TGCCCAGGCG 
GCCGAGGAAG GCGGTGGGCG CGTCAAGTTC GCCTATCTCT CGGCCGATTT CGCCAACCCG 
ACCGGCGAGA CGGTGGATCG CGCCGGTCGC GAGCGTGTGC TCGCGCTTGC CGAGGAGCTC 
GACATCGCCG TCATCGAGGA TGCGGCCTAC CAGTCGCTGC GCTATGACGG CGAGGCGGTT 
CCGCCGATCC TGGCGTTGGA GATCGCCCGC AAGGGCGACA TAAACAACAC CCGCACAATC 
TATTGCGGCA GCTTCTCGAA GACGCTGGCG CCGGGCCTTC GCGTCGGCTG GATCTGTGCC 
GCCGAGCCGG TGATCCGCAA GCTGGTGCTG ATGAAGCAGG CCGCGGACCT TCACTCTTCG 
ACGATCAATC AGATGGCGAT CGCGACGGTC GCCGAGCGCG GCTTCGATGA GCAGGTGAAG 
AAAATTCACG GGGCCTACAG GCAGCGCCGC AACGCCATGC TCTTGGCGCT CGAGAGATAC 
ATGCCTGCTG GCGTCACCTG GACGAAGCCC GAAGGCGGCA TGTTCATATG GGTAACCTTG 
CCAAAGGGCA CCGATGGCGC GGAGCTGCTC GCCAAATCGA TCGAGACAGC CAAGGTGGCC 
TTTGTACCAG GCCGCGCCTT CTTCGCTGAC GGCTCAGGTG AAAACACGCT GCGGCTCAGC 
TTCTCCTGCG CCAACGGCAG GATGATCGAC GAGGGCATCC GCCGACTCGG CGACCTCGTC 
CGCGGCGAGG TTGCACAGGC GGCGTAA

Protein sequence

MLNWESIFAT RSNRMRASEI RELLKLLDRP EIISFAGGIP DPELFPNDAF KEAYAEIFGG 
PTVGAALQYS VSEGYRPLRE WLAGQMAAIG IPASVDNIFI TSGSQQGLDY LGKLFLSPKD 
TALVTWPTYL GALQAFNAYE PTYDQLNPAG NRTPGAYAQA AEEGGGRVKF AYLSADFANP 
TGETVDRAGR ERVLALAEEL DIAVIEDAAY QSLRYDGEAV PPILALEIAR KGDINNTRTI 
YCGSFSKTLA PGLRVGWICA AEPVIRKLVL MKQAADLHSS TINQMAIATV AERGFDEQVK 
KIHGAYRQRR NAMLLALERY MPAGVTWTKP EGGMFIWVTL PKGTDGAELL AKSIETAKVA 
FVPGRAFFAD GSGENTLRLS FSCANGRMID EGIRRLGDLV RGEVAQAA