Gene Smed_3439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3439
Symbol	nusA
ID	5324325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3644337
End bp	3645995
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	61%
IMG OID	640792389
Product	transcription elongation factor NusA
Protein accession	YP_001329092
Protein GI	150398625
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.787039
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCTGC AACAGACGGA GACAAGAGAC ATGGCAGTCA GTGCTAACCG GCTCGAACTT 
CTGCAGATCG CAGATGCTGT GGCACGCGAA AAGGTGATCG ACCGCGAGAT CGTTCTGGCC 
GCGATGGCGG ATGCGATCCA GAAGGCGGCT CGTTCGCGCT ACGGTTCGGA ATCGAACATC 
CGCGCCGACA TCAATCCGAA GACCGGGGAA ATCCGTCTCC AGCGCCTCCT GGAAGTGGTC 
GAAAAGGCGG AAGACTATTC GACTCAGATT CCGATCGAAC TCGCCCGCGA TCGCAATCCC 
GATGCAAAGC TCGGCGATTT CATCGCCGAT CCGCTCCCGC CCATGGATTT TGGCCGCATC 
GCCGCTCAGT CGGCCAAGCA GGTTATCGTG CAGAAGGTGC GCGAAGCCGA GCGCGACCGC 
CAGTACGACG AGTTCAAGGA CCGTGTCGGC GAGATCGTCA ACGGCACCGT CAAGCGCGTC 
GAATATGGCA ATGTCATCGT CGATCTCGGG CGCGGTGAAG GCATCATCCG GCGCGACGAG 
ATGATCCCGC GCGAAAACAT GCGTTACGGC GACCGCGTCC GTGCCTTTGT CTACGACGTG 
CGCCGCGAGC AACGCGGACC GCAGATATTC CTGTCGCGCA CCCATCCGCA GTTCATGGTG 
AAGCTCTTCA CCATGGAGGT ACCGGAAATC TACGACGGCG TCATCCAGAT CAAGTCGGTT 
GCCCGCGATC CGGGCTCGCG CGCCAAGATC GCCGTCGTCT CGAACGATTC GTCGATCGAT 
CCGGTCGGCG CCTGCGTCGG CATGCGCGGC TCGCGCGTGC AGGCTGTCGT CGGTGAACTC 
CAGGGCGAAA AGATCGATAT CATCCCGTGG TCGCCGGATC CGGCTTCCTT CATCGTCAAT 
GCGCTGCAGC CGGCGGAAGT GGCGAAGGTC GTTCTAGACG AGGATGCGGA GCGTATCGAA 
GTCGTGGTTC CGGACGAGCA GCTTTCGCTC GCCATCGGCC GCCGCGGCCA GAACGTCCGT 
CTCGCCTCGC AGCTGACCGG ATGGGATATC GATATCCTCA CCGAACAGGA GGAGAGCGAG 
CGCCGTCAGA AGGAATTCAA CGAGCGCACA CAGCTCTTCA TGGAAGCCCT GGACGTCGAC 
GAGATGGTAG GCCAGGTGCT CGCCTCCGAA GGCTTTGCCC AGGTGGAAGA GCTCGCTTAT 
GTCGATCTCG ACGAAATTGC CTCCATCGAG GGCTTCGACG AGGAAACGTC GAACGAGATC 
CAGACCCGCG CCCGCGAATA TCTCGAAAAG ATCGAGGCGG AAATGGACGC CAAGCGCAAG 
GAACTCGGTG TTGCCGACGA GCTGCGCACG ATCAATGGGC TCAACAGCCA GATGCTGGTC 
GCTCTCGGCG AGGAAGGCAT CAAGACGATA GAGGACTTTG CCGGCTGCGC CGCCGACGAC 
CTCGTAGGCT GGGTCGAACG CAAGGATGGT GAGACCAAGC GCTTCGAGGG AACGTTCTCG 
AAGCTCGAGG TTACCCGGGA AGAGGCCGAA GCGATGATCG TGCAGGCTCG TCTCGCTGCC 
GGCTGGATCA CCGAAGAGGA TCTGGCCAAA CAACAGGAGG AAGAGCCGGA ACAGGATGAG 
ACGATCGAAG TCGCCGAAGG CGCGGATCAG GACGCCTGA

Protein sequence

MRLQQTETRD MAVSANRLEL LQIADAVARE KVIDREIVLA AMADAIQKAA RSRYGSESNI 
RADINPKTGE IRLQRLLEVV EKAEDYSTQI PIELARDRNP DAKLGDFIAD PLPPMDFGRI 
AAQSAKQVIV QKVREAERDR QYDEFKDRVG EIVNGTVKRV EYGNVIVDLG RGEGIIRRDE 
MIPRENMRYG DRVRAFVYDV RREQRGPQIF LSRTHPQFMV KLFTMEVPEI YDGVIQIKSV 
ARDPGSRAKI AVVSNDSSID PVGACVGMRG SRVQAVVGEL QGEKIDIIPW SPDPASFIVN 
ALQPAEVAKV VLDEDAERIE VVVPDEQLSL AIGRRGQNVR LASQLTGWDI DILTEQEESE 
RRQKEFNERT QLFMEALDVD EMVGQVLASE GFAQVEELAY VDLDEIASIE GFDEETSNEI 
QTRAREYLEK IEAEMDAKRK ELGVADELRT INGLNSQMLV ALGEEGIKTI EDFAGCAADD 
LVGWVERKDG ETKRFEGTFS KLEVTREEAE AMIVQARLAA GWITEEDLAK QQEEEPEQDE 
TIEVAEGADQ DA