Gene TM1040_2910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2910
Symbol	nusA
ID	4078588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	3077203
End bp	3078819
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	59%
IMG OID	638008239
Product	transcription elongation factor NusA
Protein accession	YP_614904
Protein GI	99082750
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTATCA CCTCTGCAAA CCAGCTGGAG CTGTTGCAAA CCGCCGAGGC CGTGGCGCGT 
GAGAAAATGA TCGATCCCGG TCTGGTGGTC GAAGCGATGG AAGAATCCCT CGCCCGCGCC 
GCCAAGAGCC GCTACGGCAG CGAGATGGAC ATTCGTGTCT CCATTGACCG CAAGACCGGT 
AAGGCGACTT TCACTCGTGT GCGCACCGTG GTCGAAGACG AAGAGCTCGA AAACTACCAG 
TCCGAGCTGA CCGTCGCGCA GGCCAAGCAG TATATGGAAG ACCCCAAGGT CGGCGACACC 
ATCGTTGATG AGGTTCCCCC GGTCGAGATG GGCCGGATCG CGGCACAATC CGCCAAGCAG 
GTGATCCTGC AGAAAGTGCG CGAAGCAGAG CGGGATCGTC AGTACGAAGA GTTCAAGGAT 
CGCAACGGCA CCATCATCAA TGGCGTCGTC AAGCGAGAGG AATACGGCAA CGTCATCGTC 
GATATCGGAT CTGGCGAAGG CATTCTGCGT CGCAACGAGA AAATCGGCCG TGAGAGCTAT 
CGCCCGAACG ACCGTATTCG CTGCTTCATC AAGGACGTAC GCCGCGAACC CCGTGGCCCG 
CAGATCTTCC TCAGCCGCAC CGCGCCGGAG TTCATGGCCG AGCTCTTCAA GATGGAAGTG 
CCTGAAATCT ATGACGGCAT CATCGAGATC AAGGCTGTGG CCCGTGACCC CGGTTCGCGT 
GCAAAGATCG CTGTTGTGTC CTATGACGGG TCGATCGATC CGGTTGGCGC CTGTGTCGGT 
ATGCGTGGCT CCCGCGTGCA GGCGGTCGTG AACGAACTGC AGGGCGAAAA GATCGACATC 
ATCCCTTGGA ACGAAGATCA GCCGACCTTC CTTGTGAACG CGCTGCAGCC CGCAGAGGTC 
TCCAAGGTTG TCTTGGACGA AGAAGCCGGC AAGATCGAAG TGGTTGTGCC CGACGAGCAG 
CTTTCTCTGG CGATTGGCCG TCGCGGTCAG AACGTACGTC TGGCGTCTCA GCTGACCAAC 
CTCGACATCG ACATCATGAC GGAAGAGGAA GAATCCGCAC GCCGTCAGAA GGAATTCGAG 
GCGCGCACCG CACTGTTCAT GGAAACGCTC GATCTCGACG AGTTCTTTGC ACAGCTTCTG 
GTTTCTGAAG GCTTCACCAA CCTCGAAGAG GTCGCCTATG TCGAACTCGA CGAACTCTTG 
GTGATCGATG GCGTCGACGA AGGCACCGCC GAAGAACTGC AGGCCCGCGC GCGCGATTAT 
CTCGAAGCCA AGGCCAAGGC CGCGCTCGAC AACGCCCGCA GCATGGGCGT CGAGGACAGC 
CTTATTGACT TTGACGGCCT GACACCCCAG ATGGTTGAGG CACTGGCGAA GGATGATGTG 
AAATCGCTTG AAGACTTCGC AACCTGTGCG GACTGGGAGC TTGCGGGTGG CTGGACCACC 
GTCAACGGCG AGCGTGTCAA GGATGAAGGG ATTCTCGAGC CCTTCGATGT GAGCCTCGAA 
GAGGCGCAAA ATCTGGTGAT GACGGCGCGG ATTATGCTCG GCTGGGTCGA CCCGGCAGAA 
CTTGAATCCG ATGCTGATGA TCTCGAGGAA GAAGCCGAAG GGGAAGCGGA AGCCTGA

Protein sequence

MAITSANQLE LLQTAEAVAR EKMIDPGLVV EAMEESLARA AKSRYGSEMD IRVSIDRKTG 
KATFTRVRTV VEDEELENYQ SELTVAQAKQ YMEDPKVGDT IVDEVPPVEM GRIAAQSAKQ 
VILQKVREAE RDRQYEEFKD RNGTIINGVV KREEYGNVIV DIGSGEGILR RNEKIGRESY 
RPNDRIRCFI KDVRREPRGP QIFLSRTAPE FMAELFKMEV PEIYDGIIEI KAVARDPGSR 
AKIAVVSYDG SIDPVGACVG MRGSRVQAVV NELQGEKIDI IPWNEDQPTF LVNALQPAEV 
SKVVLDEEAG KIEVVVPDEQ LSLAIGRRGQ NVRLASQLTN LDIDIMTEEE ESARRQKEFE 
ARTALFMETL DLDEFFAQLL VSEGFTNLEE VAYVELDELL VIDGVDEGTA EELQARARDY 
LEAKAKAALD NARSMGVEDS LIDFDGLTPQ MVEALAKDDV KSLEDFATCA DWELAGGWTT 
VNGERVKDEG ILEPFDVSLE EAQNLVMTAR IMLGWVDPAE LESDADDLEE EAEGEAEA