Gene Dole_3036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3036
Symbol	nusA
ID	5695895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3642574
End bp	3644001
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	58%
IMG OID	641265652
Product	transcription elongation factor NusA
Protein accession	YP_001530916
Protein GI	158523046
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00201036
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCATAC AGGACGTGAA ACGTGTTGTA GAACAGGTCA GCCGGGACAA GGGCATTGAC 
AGGGACACTC TTGTGAAGGC CCTTGAAGAG GCCATCAAGT CTGCGGCTCG GAAGCGGTAT 
GGCGCGGCTA TCGATATCGA AACCATGTAT GATGAGGATA CCGGCGAAAT TGAGATATTC 
CAGTTCAAGG AGGTGGTTGA AACCGTCCAG GACCCGGATC TGCAGATCAC GTTTGTGGAG 
GGCAGGGCCC TGGATCCGGA GTGTGAACTG GGAGACAGCC TCGGTGTGAA GATGGACACG 
CAGTCCTTTG GCCGTATCGC GGCCCAGTCG GCCAAGCAGG TTATTATTCA GAAGATGCGG 
GAGGCGGAGC GAAGCGCGGT CTACAAGAAT TTCGTGGAAA AAGAGGGTGA GATCATCAAC 
GGTATCGTCT CCCGCATGGA GCGCGGTAAC GTGATTGTCA ATATCGGCGA GGCCGAGGCG 
ATTCTTAACT CCCGGGAACA GATTCCCGGC GAAGGCTACC GCCGGGGGGA CAGGGTGCGG 
GCCAATGTGA TGAAAGTGCT TGAGGAGACC GCCGGCCCCC AGATTATCCT GTCCCGGGCC 
CATCCGGATT TTGTGGTCAA TCTCTTCAAG ACGGAAGTGC CGGAAATCAG CGAAGGTATC 
ATTACCATCA AGGCCATTGC CCGGGAGGCC GGCGGGCGGA CCAAGATCGC TGTGGTTTCC 
AACGACATGG ATATCGACCC GGTGGGTGCC TGCGTGGGGG TCCGGGGCAA CCGGATTCAG 
AACGTGGTCA AGGAGCTCAA AGGGGAAAAG ATCGATATCG TTCCCTGGAA CCCGGACCCG 
GCCAAGTTCG TCTGCAACGC GCTTTCTCCG GCAGAGATAG CCCGTGTGAT CATCGACGAG 
GACAATGCGG CCATGGAGAT CATCGTGCCC GACGAGTCCC ACTCTCTTGC CATCGGCCGA 
AGAGGGCAGA ATGTGCGGCT TGCCTCCAAG CTGACCGGCT GGCACCTTGA TGTACAGAGC 
GAGTCCATAT ACACCCAGGC CATGGAACGG GGGTATGACA CGCTTCTTCA GATACCCGGT 
GTGGATGGGT CCCTGGCAAA TGCGCTGTGT GAAGTCGGGT TTTTCTCGGC GGATGATATT 
TCCGGTGCCG CGGTTGATGA CCTGATTGAA CTGGAAGGCA TTGATGAAGC CTCGGCAAAG 
GCGTTGATCC GTGACGCGGT CAAGGTTGCG GAGCAGGCAG CCAGGGAGCA GGCAATCAGG 
GAGAAAGCAG CCAAAGAGCA GGCAGCCAAA GAACAGGCAG CCAGGGTGCA GGCGGCAGAA 
GAAGCATCTC CGGCGCCAGA TGAAGAAGCG CCGAATAAAG AGGCGCCGGA TAACGACATT 
GCGCCAGCCG GAGAGACCCC GGCGGATGAC GGCCATGAGC CGGTATAA

Protein sequence

MIIQDVKRVV EQVSRDKGID RDTLVKALEE AIKSAARKRY GAAIDIETMY DEDTGEIEIF 
QFKEVVETVQ DPDLQITFVE GRALDPECEL GDSLGVKMDT QSFGRIAAQS AKQVIIQKMR 
EAERSAVYKN FVEKEGEIIN GIVSRMERGN VIVNIGEAEA ILNSREQIPG EGYRRGDRVR 
ANVMKVLEET AGPQIILSRA HPDFVVNLFK TEVPEISEGI ITIKAIAREA GGRTKIAVVS 
NDMDIDPVGA CVGVRGNRIQ NVVKELKGEK IDIVPWNPDP AKFVCNALSP AEIARVIIDE 
DNAAMEIIVP DESHSLAIGR RGQNVRLASK LTGWHLDVQS ESIYTQAMER GYDTLLQIPG 
VDGSLANALC EVGFFSADDI SGAAVDDLIE LEGIDEASAK ALIRDAVKVA EQAAREQAIR 
EKAAKEQAAK EQAARVQAAE EASPAPDEEA PNKEAPDNDI APAGETPADD GHEPV