Gene SeD_A3644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3644
Symbol	nusA
ID	6871595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3497440
End bp	3498942
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	52%
IMG OID	642786624
Product	transcription elongation factor NusA
Protein accession	YP_002217260
Protein GI	198243925
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAG AAATTTTGGC TGTTGTTGAA GCCGTCTCCA ACGAAAAAGC GCTGCCACGC 
GAAAAAATTT TTGAAGCGCT GGAAAGTGCG CTGGCGACAG CAACAAAGAA AAAATATGAG 
CAGGAGATCG ATGTTCGTGT AGAAATCGAT CGTAAAAGCG GTGATTTTGA TACTTTCCGC 
CGTTGGTTGA TCGTTGAAGA AGTGACCATG CCGACGAAGG AAATTACGCT GGAAGCGGCG 
CGTTTTGAAG ACGAAAGCCT GAATGTCGGC GACTATGTTG AAGATCAGAT TGAATCTGTC 
ACCTTTGACC GTATCACCAC GCAGACTGCG AAACAGGTTA TCGTACAGAA GGTCCGTGAA 
GCTGAACGCG CGATGGTTGT CGATCAGTTC CGCGACCAGG AAGGCGAAAT TGTCACTGGC 
GTGGTGAAGA AAGTGAACCG CGACAATATC TCTCTGGAAA TTAAATCCGA AGGGATGGCC 
GGTAACGCTG AAGCGGTGAT TCTGCGTGAA GATATGCTGC CGCGTGAAAA CTTCCGTCCG 
GGCGACCGCA TCCGCGGTGT TCTGTACGCT GTACGTCCAG AAGCGCGTGG CGCGCAGCTG 
TTCGTCACCC GTTCCAAGCC GGAAATGCTG ATCGAACTGT TCCGCATCGA AGTGCCGGAA 
ATCGGCGAAG AAGTGATTGA AATTAAAGCG GCGGCTCGCG ATCCGGGTTC TCGTGCGAAA 
ATCGCAGTGA AAACCAACGA TAAACGTATC GATCCGGTCG GCGCTTGTGT GGGGATGCGC 
GGCGCGCGCG TTCAGGCGGT CTCTACCGAA CTGGGCGGTG AGCGTATCGA TATCGTGCTG 
TGGGATGATA ACCCGGCGCA GTTCGTCATT AATGCGATGG CGCCGGCAGA CGTCGCGTCT 
ATCGTGGTGG ACGAAGATAA ACATACCATG GATATCGCCG TTGAAGCCGG TAATCTGGCG 
CAGGCGATCG GACGTAATGG TCAGAACGTC CGCCTGGCTT CGCAATTGAG CGGCTGGGAA 
CTCAACGTAA TGACCGTTGA TGACTTGCAG GCTAAACATC AGGCTGAAGC ACATGCCGCT 
ATCGAGATCT TTACTAAATA TCTTGATATT GATGAAGAGT TCGCGACCGT TCTGGTAGAA 
GAAGGTTTCT CCACGCTCGA GGAACTGGCC TATGTGCCAA TGAAAGAACT GCTGGAAATT 
GACGGCCTTG ATGAGCCGAC CGTTGAAGCA CTGCGCGAGC GTGCTAAAAA CGCACTGGCC 
ACTCTGGCGC AGGACCAGGA AGCAAGCCTC GGTGATAACA AACCGGCTGA CGATCTGCTG 
AATCTGGAAG GATTAGATCG CGATATGGCT TTCAAACTGG CGGCTCGTGG TGTTTGTACG 
CTGGAAGATC TCGCCGACCA GGGCATTGAT GATCTGGCTG ATATCGAAGG GTTGACCGAC 
GAAAAAGCCG GTGAGCTGAT TATGGCTGCC CGTAATATTT GCTGGTTCGG CGACGAAGCG 
TAA

Protein sequence

MNKEILAVVE AVSNEKALPR EKIFEALESA LATATKKKYE QEIDVRVEID RKSGDFDTFR 
RWLIVEEVTM PTKEITLEAA RFEDESLNVG DYVEDQIESV TFDRITTQTA KQVIVQKVRE 
AERAMVVDQF RDQEGEIVTG VVKKVNRDNI SLEIKSEGMA GNAEAVILRE DMLPRENFRP 
GDRIRGVLYA VRPEARGAQL FVTRSKPEML IELFRIEVPE IGEEVIEIKA AARDPGSRAK 
IAVKTNDKRI DPVGACVGMR GARVQAVSTE LGGERIDIVL WDDNPAQFVI NAMAPADVAS 
IVVDEDKHTM DIAVEAGNLA QAIGRNGQNV RLASQLSGWE LNVMTVDDLQ AKHQAEAHAA 
IEIFTKYLDI DEEFATVLVE EGFSTLEELA YVPMKELLEI DGLDEPTVEA LRERAKNALA 
TLAQDQEASL GDNKPADDLL NLEGLDRDMA FKLAARGVCT LEDLADQGID DLADIEGLTD 
EKAGELIMAA RNICWFGDEA