Gene Smed_1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1089
Symbol
ID	5321935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1156651
End bp	1157793
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	61%
IMG OID	640790030
Product	signal transduction histidine kinase, nitrogen specific, NtrB
Protein accession	YP_001326775
Protein GI	150396308
COG category	[T] Signal transduction mechanisms
COG ID	[COG3852] Signal transduction histidine kinase, nitrogen specific
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAGA AGGCACCGGC TGACGGCGCA AACGATCTTT CCATGGCCGT GCTGAACGCG 
ATTCAGAATC CGGTCATCCT GGTGGATGAG AACGGCTTTG TCGCCTTTGC GAACTGGGAG 
GCGGAATCCT TCTTCGGTGC CAGCGCCAAC CATCTTGCGC GGCATGACAT CAGCGCGTTC 
ATTCCCTTCG GCAGCCCGCT CCTGACGCTG ATCGATCAGG TTCGCGAGCG GCGCGCTGCG 
GTGAACGAGT ACCGGGTAGA CCTCAGCTCT CCGCGCCTCG GGGCCGACAA GCTCGTCGAT 
CTCTACGTGG CCCCGGTACT CTCGCAACCC GGATCGGTGG TGGTCGTCTT TCAAGAGCGG 
TCGATGGCGG ACAAGATCGA TCGCCAGCTG ACACATCGGA CGGCGGCGCG ATCCGTCACG 
GGGCTTGCTT CGATGCTGGC GCACGAAATC AAAAACCCTC TTTCCGGCAT TCGCGGCGCC 
GCGCAGCTCC TCGAAACCTC CGTCAACGAC GAAGACAGGG CGCTCACAAG ATTGATCTGT 
GACGAGACCG ACCGCATCGT CTCGCTCGTG GACCGGATGG AGGTCTTCTC CGACGAGCGT 
CCCGTCGACC GCGTGCCCCT TAACATTCAT GCGATACTCG ACCACGTCAA GGCAATCGCG 
AAGGCCGGCT TTGCCCGGCG GATCAAGATC TCCGAACATT ATGACCCGTC GCTTCCGCCC 
GTTTTCGCAA ATCGCGACCA GCTGGTTCAG GTGTTCCTCA ATCTGGTAAA GAATGCGGCC 
GAGGCGATCG GCGACAGGGC GGACGGCGAA ATTCTGCTGA CGACGGCCTA TAGGCCGGGC 
ATTCGCCTCT CGGTCGCCGG TACGCGCGAA AAAATCTCGC TCCCGCTGGA ATTCTGCGTG 
CATGACAACG GGCCGGGTGT ACCCGCCGAT CTTCTGCCGC ATCTTTTCGA CCCTTTCATC 
ACCACCAAGA CGAACGGGTC CGGCCTCGGT CTCGCGCTTG TGGCGAAGAT CATCGGCGGC 
CATGGCGGCA TCGTCGAATG CGACAGCCAG CATAGCCGCA CGATATTCCG CGTTCTGATG 
CCGGCGTCCA AGGGCCCAGC GGCAGATGAC GAAACTCCGA TGACAAAAGG AACCAATGGA 
TGA

Protein sequence

MTEKAPADGA NDLSMAVLNA IQNPVILVDE NGFVAFANWE AESFFGASAN HLARHDISAF 
IPFGSPLLTL IDQVRERRAA VNEYRVDLSS PRLGADKLVD LYVAPVLSQP GSVVVVFQER 
SMADKIDRQL THRTAARSVT GLASMLAHEI KNPLSGIRGA AQLLETSVND EDRALTRLIC 
DETDRIVSLV DRMEVFSDER PVDRVPLNIH AILDHVKAIA KAGFARRIKI SEHYDPSLPP 
VFANRDQLVQ VFLNLVKNAA EAIGDRADGE ILLTTAYRPG IRLSVAGTRE KISLPLEFCV 
HDNGPGVPAD LLPHLFDPFI TTKTNGSGLG LALVAKIIGG HGGIVECDSQ HSRTIFRVLM 
PASKGPAADD ETPMTKGTNG