Gene Daud_0923 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_0923
Symbol	nusA
ID	6027426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	984211
End bp	985290
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	59%
IMG OID	641593735
Product	transcription elongation factor NusA
Protein accession	YP_001717068
Protein GI	169831086
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000194155
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAGCG AGTTTCTGGC GGCTTTGCGC GACCTGGAGA AAGAGCGCAG CATCAGTGTG 
GAAGTCCTGC TTGAAGCCAT CGAGGCGGCG CTTTTGTCCG CCTACCGGCG CAATTTCGGG 
ACTTCACACA ACGCGCGGGT GCAGGTTGAC CGCCACACCG GAGACTGCAA GGTGTACGCC 
AGGCGGACCG TTGTCCAGGA AGTGGAGGAC CCCCAGGATC AGATTTCCCT TGAGGAGGCC 
AGAGCCATTA ACCCGGGCTA CCAACTGGAG GACACGGTAG AATCGGAAAT CACGCCGCGC 
AATTTTGGAC GTATCGCCGC CCAAACGGCA AAACAGGTGG TGGTGCAGCG GATTCGGGAA 
GCAGAGCGAA ACATGGTCTT CGAGGAATTT GCCAGCCGCG AGGGCGACAT CGTCACCGGT 
GTGGTGCAGC GCATCGAGCA GCGCAACGTG TACATCGAAC TGGGCAAAAC CGAAGCCGTG 
CTTCCCCCGG CGGAACAGAT ACCGAGAGAG AACTACCGGC CCGGTCAACG GCTGAAGACA 
TATATTGTCG AAGTGAAGAA GACCACCAAG GGGCCGTTGA TCCTGGTTTC CCGGACTCAT 
CCGGGTCTCC TGAAGCGGCT GTTTGAGATT GAGGTTCCCG AGTTGCACCA GGGGCTGGTG 
GAACTGAAAG CGGTGGCGCG GGAGGCTGGG ATCCGGTCCA AGATCGCCGT CTATTCGAAT 
GATGAGGGCA TTGATCCGGT CGGGGCTTGT GTCGGCCCGA AGGGCGCCCG GGTACAGGCG 
ATCGTTCAGG AGTTGAACGG CGAGAAAATC GATGTCGTGA AGTGGAGCCC CGACTCCTCG 
AAGTTTGTGT CCAGTTCCCT GAGCCCGGCC AAGGTGATTG CGGTGGAGGT GTGGGAGGAC 
GAAAAGATCG CCCGGGTGAT CGTACCCGAC TACCAACTGT CGCTGGCCAT TGGGAAGGAA 
GGTCAAAACG CCCGCCTGGC CGCCAAGCTG ACCGGTTGGA AAATCGACAT CAAGAGCGAA 
TCGCAGATGG CTGAAATTTA CCGGGAATAT CTTGAGCAGC AGGGCTACGA GCAGGTGTGA

Protein sequence

MNSEFLAALR DLEKERSISV EVLLEAIEAA LLSAYRRNFG TSHNARVQVD RHTGDCKVYA 
RRTVVQEVED PQDQISLEEA RAINPGYQLE DTVESEITPR NFGRIAAQTA KQVVVQRIRE 
AERNMVFEEF ASREGDIVTG VVQRIEQRNV YIELGKTEAV LPPAEQIPRE NYRPGQRLKT 
YIVEVKKTTK GPLILVSRTH PGLLKRLFEI EVPELHQGLV ELKAVAREAG IRSKIAVYSN 
DEGIDPVGAC VGPKGARVQA IVQELNGEKI DVVKWSPDSS KFVSSSLSPA KVIAVEVWED 
EKIARVIVPD YQLSLAIGKE GQNARLAAKL TGWKIDIKSE SQMAEIYREY LEQQGYEQV