Gene Smed_6187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_6187
Symbol
ID	5320489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	1109669
End bp	1110736
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	58%
IMG OID	640777805
Product	nodulation factor exporter subunit NodI
Protein accession	YP_001314737
Protein GI	150378142
COG category	[V] Defense mechanisms
COG ID	[COG1131] ABC-type multidrug transport system, ATPase component
TIGRFAM ID	[TIGR01288] ATP-binding ABC transporter family nodulation protein NodI

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGGAA ACGGGCGAGT TTTGAGACAC GAAGCGGAAA ATCAATTGTC AGATCGTGAG 
ATGGCCCAAG AGGCTCCGCG TCGGCTTGAG CCGAGTCCGT TCGAGTGGAA GGACCAAACA 
GGTCCAGCCG TGAAGACCGC AATACCCGGC GCCATACCAA CCGTGGCAAT CGATGTTGCC 
AGCGTAACAA AGTCCTACGG TGACAAACCT GTAATCAACG GACTGTCGTT CACCGTTGCA 
GCGGGTGAGT GCTTCGGTCT GTTAGGTCCC AACGGTGCAG GCAAAAGTAC GATCACCCGT 
ATGATCCTCG GCATGACGAC GCCTGGTACG GGTGAGATCA CCGTGCTCGG CGTGCCGGTT 
CCGTCACGGG CTCGATTGGC ACGCATGAGG ATTGGCGTAG TTCCGCAGTT CGACAACCTC 
GACCTGGAAT TCACTGTACG CGAAAACCTG TTGGTCTTCG GGCGCTACTT CCGGATGAGC 
ACGCGCGAGA TAGAAGCGGT AATCCCATCG CTCCTTGAGT TTGCGCGCCT CGAAAACAAG 
GCGGATGCGC GTGTTTCGGA CCTGTCTGGC GGCATGAAGC GGCGCCTTAC ACTGGCACGT 
GCCCTCATCA ACGATCCCCA GCTACTGATA TTGGACGAGC CTACCACTGG ACTTGACCCG 
CACGCCCGTC ACTTGATCTG GGAACGGCTG CGGTCGTTGT TGGCACGCGG AAAGACGATT 
CTCTTGACCA CCCATATTAT GGAAGAGGCA GAGCGGTTGT GCGACCGGCT GTGCGTGCTC 
GAAGCAGGGC GCAAGATCGC CGAAGGCCGA CCTCACATGC TAATAGACGA GAAGATCGGT 
TGCCAGGTGA TAGAGATCTA CGGGGGCGAT CCACACGAGC TAAGTGCGTT GGTAAGCCCG 
CACGCCCGCC ACATCGAGGT GAGCGGCGAG ACCGTCTTCT GTTATGCGTT CGACCCGGAG 
CAAGTACGAG TCCAACTGGA TGGGCGCGCG GGTGTGCGCT TTCTGCAGCG TCCACCAAAT 
CTCGAGGACG TTTTCTTACG GTTGACCGGG CGGGAGCTGA AGGACTGA

Protein sequence

MTGNGRVLRH EAENQLSDRE MAQEAPRRLE PSPFEWKDQT GPAVKTAIPG AIPTVAIDVA 
SVTKSYGDKP VINGLSFTVA AGECFGLLGP NGAGKSTITR MILGMTTPGT GEITVLGVPV 
PSRARLARMR IGVVPQFDNL DLEFTVRENL LVFGRYFRMS TREIEAVIPS LLEFARLENK 
ADARVSDLSG GMKRRLTLAR ALINDPQLLI LDEPTTGLDP HARHLIWERL RSLLARGKTI 
LLTTHIMEEA ERLCDRLCVL EAGRKIAEGR PHMLIDEKIG CQVIEIYGGD PHELSALVSP 
HARHIEVSGE TVFCYAFDPE QVRVQLDGRA GVRFLQRPPN LEDVFLRLTG RELKD