Gene Smed_6181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_6181
Symbol
ID	5320483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	1103589
End bp	1104914
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	57%
IMG OID	640777799
Product	nitrogenase molybdenum-cofactor biosynthesis protein NifN
Protein accession	YP_001314731
Protein GI	150378136
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01285] nitrogenase molybdenum-iron cofactor biosynthesis protein NifN

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCCGCA TCCTTTCTCA GACTAAATGG GCAACGATCA ACCCCCTGAA ATCGTCGCAG 
CCGCTGGGTG GCGCCTTGGC CTTTCTTGGT GTCGATGGTG CGATACCGCT ATTCCATGGC 
AGTCAAGGTT GCACCAGCTT TGCACTGGTG CTTCTCGTTA GGCACTTCAA GGAAGCGATT 
CCCTTGCAAA CCACCGCGAT GGACGACGTG GCAATAGTCC TCGGCGGGGC GGGTCATTTG 
GAGCAGGCGA TCCTCAATCT CAAAATTCGC GCAAAGCCAA AGCTGATCGG TATATGCACC 
ACGGCGCTGG TGGAAACTCG TGGCGAAGAT CTGGTGGGTG ATCTCGCCAG TATCAAGCTG 
GAGCGCGCGG AAGAACTCAC AGGTACCGAC GTCGTGCTGG CCAATACACC GGATTTTGAC 
GGCGCTATGG AGGAGGGTTG GGCCAAGGCT GTCACAGCAA TGATCAAAGC GATTACACGA 
ATCGGCGAGC AGGAGCGGCA GTCGAGAACT ATAGCAATTC TCCCTGGGTG GAATCTCACT 
ATAGCTGACA TCGAGCAGTT GCGCGATATA GTAGAAAGCT TCGGGCTCAA GCCGATCATC 
CTGCCGGACC TCTCTGGCTC GCTTGATGGT ATAGTGCCCG ATGGCCGCTG GGTGCCGACG 
ACATACGGCG GCATCAGCGT CGAGGAGATA CGCGAGCTTG GCACAGCAGC GCAGTGCATA 
GCCATTGGTG AGCATATGCG CGGTCCAGCA GAGGAGATGA AGACGCTGAC CGGAGTTCCT 
TACGTGCTGT TTCAGTCGCT GACAGGATTA AATGCGGTCG ACCGGTTTGT CTCGCTACTT 
TCCTCTATTT CCGGTCGGCC CGCGCCCGCG AAAGTCCGCC GGCGCCGCGC ACAGCTGCAG 
GATGCCCTGC TGGACGGACA TTTCCACTCG GCTGGCAAGA AGATTGCGAT CGCAGCCGAG 
CCGGACCAGC TCTATCAACT CGCTACGTTC TTCATTTGCC TGGGTGCCGA GATTGTGGCA 
GCCGTTACCA CGAAAGGTGC GTCGAAAATC CTTCACAAAG TACCGGTGGA AGTAATTCAG 
GTCGGCGACC TCGGCGACTT GGAAAGTCTT GCCACCCATG CTGATCTTCT CGTCACGCAT 
TCGCACGGCC AGCACGCTTC AGCACGTCTC GGCACTCCGC TAATGCGCGT CGGTTTTCCT 
GTCTTCGACC AACTGGGCAG TCAGCACAAG CTCACAATTC TGTATCACGG AACGCGCGAC 
TTGATCTTCG AAGTTTCCAA CATCTTCCAA TCCCATTCCC TTGCGCCGAC GCACCGGGGA 
ACGTGA

Protein sequence

MVRILSQTKW ATINPLKSSQ PLGGALAFLG VDGAIPLFHG SQGCTSFALV LLVRHFKEAI 
PLQTTAMDDV AIVLGGAGHL EQAILNLKIR AKPKLIGICT TALVETRGED LVGDLASIKL 
ERAEELTGTD VVLANTPDFD GAMEEGWAKA VTAMIKAITR IGEQERQSRT IAILPGWNLT 
IADIEQLRDI VESFGLKPII LPDLSGSLDG IVPDGRWVPT TYGGISVEEI RELGTAAQCI 
AIGEHMRGPA EEMKTLTGVP YVLFQSLTGL NAVDRFVSLL SSISGRPAPA KVRRRRAQLQ 
DALLDGHFHS AGKKIAIAAE PDQLYQLATF FICLGAEIVA AVTTKGASKI LHKVPVEVIQ 
VGDLGDLESL ATHADLLVTH SHGQHASARL GTPLMRVGFP VFDQLGSQHK LTILYHGTRD 
LIFEVSNIFQ SHSLAPTHRG T