Gene Daro_2453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2453
Symbol	nusA
ID	3568226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	2654472
End bp	2655944
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	55%
IMG OID	637680921
Product	transcription elongation factor NusA
Protein accession	YP_285658
Protein GI	71908071
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.0000540151
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.905596
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGTG AAATTTTGCT GCTGGTCGAT GCTCTGGCCC GCGAAAAAAA TGTCAGCAAG 
GAGATCGTCT TTGGCGCCCT TGAGCTGGCA CTCGCGTCAG CGACCAAAAA GCGCATCAAT 
GACGAGGCCG ATGTTCGTAT CTCAATCGAT CGCGACACTG GTAGCTTCGA ATCATTCCGT 
CGCTGGCAGG TTGTGCCGGA TAACGAATAC GTCAACGAAT TCCTCGAAAT TCCGTTGTCC 
GATGCCCAGA AGGATGATCC TGAAATCGAG CCCGGCGACT CTCTGGAAGA GCCGCTTGAG 
CCGATCGATT TTGGTCGTAT CGGTGCTCAG GCTGCCAAAC AGGTTATTTT GCAGAAGATC 
CGCGACGCCG AGCGCGAGCA GATTCTGGCT GACTTTCTTG GTCGCGGCGA GCATGTCGTT 
TCCGGTACCA TCAAGCGCAT GGAGCGTGGC AACGCCATTA TTGAGGCTGG TAAAATTGAA 
GCCATGCTGC CGCGCGACCA GATGATCCCC AAGGAAAATC TGCGTGTCGG CGACAGAGTT 
CGTGCCTATT TGCTGCGCAT TGATCGCAAT GCCCGTGGTC CGCAAATCAT CCTTTCGCGC 
ACCGCTCCGG AATTTGTCAT CAAGCTTTTT GACATGGAAG TGCCGGAAAT TTCCGATGGC 
CTGATGGAAC TCAAGGCCTG TGCCCGTGAC CCCGGTCTGC GCGCCAAAAT CGCTGTCAAG 
TCGAACGATC CCCGTGTTGA TCCAATCGGT ACCTGCGTCG GTTTGCGCGG TTCCCGGGTT 
ACCGCCGTTC GTAACGAAAT CGGTGGCGAG AATATCGACA TCGTGCTGTG GTCAGCCGAT 
CCGGCGCAAT TCGTTATCGG CGCGTTGTCG CCAGCTGAAG TGTCCTCCAT CGTGGTTGAT 
GAAGAAAAGC ACGCAATGGA TGTCGTGGTC GACGAGGATA ACCTTGCGAT CGCCATCGGT 
CGCAACGGGC AGAACGTTCG CCTGGCCTCC GAACTGACTG GCTGGACCAT CAATCTGATG 
ACGCAGGACG AGTCGGCCAA GAAATCCGAA GCCGAATTCG CCGAGACGCG CGTCGTCTTT 
ATGGAAAAGC TGGATATCGA TGAAGAACTT GCCGATCTGC TGATCGAGGA AGGGTTCTCG 
ACGCTGGAAG AAGTGGCCTA CGTGCCGCTG GCAGAAATGC TGGAAATCGA AGGTCTGGAT 
GAGGAAATCG TAAATGAGTT GCGTAATCGG GCTCGTAACG TCCTGCTCAC CGAGGCTATC 
GCAACTGAAG AAAAGCTGGA AAGTGTTTCC GAAGACCTGA TTGGTCTCGA AGGCATGAGC 
AAGGAACTGG CCGCCAAACT GGCTGGACAC GATGTCAAAA CCCGGGATGA TCTCGCGGAA 
TTGGCTGTTG ATGAATTGAC GGAAATGACC GGCATTGACG ATGAGCGTGC CAAGGATCTT 
ATCCTGAAGG CACGGGCTCA CTGGTTCGAG TGA

Protein sequence

MSREILLLVD ALAREKNVSK EIVFGALELA LASATKKRIN DEADVRISID RDTGSFESFR 
RWQVVPDNEY VNEFLEIPLS DAQKDDPEIE PGDSLEEPLE PIDFGRIGAQ AAKQVILQKI 
RDAEREQILA DFLGRGEHVV SGTIKRMERG NAIIEAGKIE AMLPRDQMIP KENLRVGDRV 
RAYLLRIDRN ARGPQIILSR TAPEFVIKLF DMEVPEISDG LMELKACARD PGLRAKIAVK 
SNDPRVDPIG TCVGLRGSRV TAVRNEIGGE NIDIVLWSAD PAQFVIGALS PAEVSSIVVD 
EEKHAMDVVV DEDNLAIAIG RNGQNVRLAS ELTGWTINLM TQDESAKKSE AEFAETRVVF 
MEKLDIDEEL ADLLIEEGFS TLEEVAYVPL AEMLEIEGLD EEIVNELRNR ARNVLLTEAI 
ATEEKLESVS EDLIGLEGMS KELAAKLAGH DVKTRDDLAE LAVDELTEMT GIDDERAKDL 
ILKARAHWFE