Gene Hoch_3855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3855
Symbol
ID	8546248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5306885
End bp	5308501
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	68%
IMG OID	646388524
Product	NusA antitermination factor
Protein accession	YP_003268247
Protein GI	262197038
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0719337
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0942338
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACCCA ATCTCAACAT GGTCATCGAC CAGGTCGGTC GCGACAAGAA CATCGAGCGC 
GATGTCCTGG TTCAGGCGCT CGAGCAGGCG ATCCTCACCG CTGCGAAGAA GACCTTCGGG 
GCCAGTCGTG AGCTCGAGGC GCAGTACAAC GAGGATACCG GCGTGGTCGA CCTCTTCCTC 
ATCGTCAATG TGGTCGAGGA TGAAGAGGAC GCCATCTACG GTCGCGAGAT CACGGCTCCC 
GACGCTGAGA CCCACGGCCT CGAGGCCGAG ATCGGCGACG AGCTGCTGTT CCAGGTCTTC 
TACCGCGCCG AGGACAATGA GCGCGCGTCC GAGCAGGACG CCAAGTTCGG CGACCTGATC 
GACCTCAAGA ACGCCCACAA GCGCTTCGGC CGCATCGCCG CGCAGACCGC CAAGCAGGTG 
ATCTACCAGC GCGTGCGCGA GGCCGAGCGC GACAACGTCT ACAACGAGTA CAAGGACCGC 
AAGGGCGAGC TCATCACCGG CATCGTGCGC CGCTTCGAGC GCGGCAGCAT CGTCGTCGAT 
CTCGGCCGCG CCGAGGCCAT CTTGCCGACC CGCGATCAGG TGCCGCGCGA GTCGTATCGC 
GTGGGCGACA GCATCAAGGC CTACGTGCTC GACATCGACC GCAACGCGCG CGGCCCGCAG 
ATCATCCTCT CGCGCACGCA CAAGGGCCTG CTCGAGAAGC TGTTCGAGCA AGAGGTGCCC 
GAGATCTACG AGAAGATCGT GCGCATCGAG TCGTCGGCTC GCGAGCCCGG CGCCCGCGCC 
AAGATCGCGG TGTCCTCGCG CGACCGCGAC GTCGATCCCG TGGGCGCCTG CGTCGGCATG 
AAGGGCTCGC GCGTCCAGGC CGTGGTCCAG GAGCTGCGCG GCGAGAAGAT CGACATCGTG 
CCCTACGACG AGGATCCGGC GCGCTTCGTG TGCAACGCGA TCGCGCCCGC CGAGGTCTCG 
CGCGTGCTCA TCGACGCCGA CGGCCACCGC ATGGAGCTGG TGGTGCCCGA CGACAAGCTG 
TCGCTGGCCA TCGGCAAGAA GGGCCAGAAC GTGCGTCTGG CCTCGCAGCT CACCGGCTGG 
CGCATCGATA TCCACTCGGA GTCGAAGATC CAGGATCTCG AGCGCCGCGC CAAGGAGCAG 
CTCGCCGCGG TCGAGGGCAT GGACGACGAT CTCGCCGACA CCGTGTTCCG CCTCGGCTGG 
CGCTCGGTGG GCGAGCTGTC GCGGGCCGCG CCCGAAGAGC TCGCCGGCGT GCCCGGCATC 
GACGGTGTCG AGGTCGGCCG CCAGGTGGTC GCCGGCGCGC GCGCGTTCCT CGAGGAGGAG 
AAGCTGCGCC AGGAGCACGC TCGCCGTGAG GCCGATCGCC GCAACAGCCT CAGCGATCGC 
GAGCGCCTGC TCGAGGTCCG CGACATGAGC GAGGCGATCG CCGACCAGCT CGCCGAGGAG 
GCGCAGGTGA TGCGCGTCGA GGATCTGGCC CGCTGGCCGC TCGACCGCCT GACCATGGCC 
GACATCGACG AGGATACTCT GCGCACGCTG CGCCACTGGG CGCGGGTGTG GCTGGGCGAC 
ATCTCGGCCG ACGCGCCGCC GCCCAAACCC CGCCGCAGCG AAGAGTCCGA GGCCTAG

Protein sequence

MQPNLNMVID QVGRDKNIER DVLVQALEQA ILTAAKKTFG ASRELEAQYN EDTGVVDLFL 
IVNVVEDEED AIYGREITAP DAETHGLEAE IGDELLFQVF YRAEDNERAS EQDAKFGDLI 
DLKNAHKRFG RIAAQTAKQV IYQRVREAER DNVYNEYKDR KGELITGIVR RFERGSIVVD 
LGRAEAILPT RDQVPRESYR VGDSIKAYVL DIDRNARGPQ IILSRTHKGL LEKLFEQEVP 
EIYEKIVRIE SSAREPGARA KIAVSSRDRD VDPVGACVGM KGSRVQAVVQ ELRGEKIDIV 
PYDEDPARFV CNAIAPAEVS RVLIDADGHR MELVVPDDKL SLAIGKKGQN VRLASQLTGW 
RIDIHSESKI QDLERRAKEQ LAAVEGMDDD LADTVFRLGW RSVGELSRAA PEELAGVPGI 
DGVEVGRQVV AGARAFLEEE KLRQEHARRE ADRRNSLSDR ERLLEVRDMS EAIADQLAEE 
AQVMRVEDLA RWPLDRLTMA DIDEDTLRTL RHWARVWLGD ISADAPPPKP RRSEESEA