Gene Hoch_3940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3940
Symbol
ID	8546336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	5433942
End bp	5435279
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	77%
IMG OID	646388612
Product	domain of unknown function DUF1730
Protein accession	YP_003268332
Protein GI	262197123
COG category	[C] Energy production and conversion
COG ID	[COG1600] Uncharacterized Fe-S protein
TIGRFAM ID	[TIGR00276] iron-sulfur cluster binding protein, putative

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0385564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0104951
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCCAG ACGCCGGCGA GACGCGGCCC GAGCGGCTGC GCGAGCTGCT GGTGCGCGGC 
GCCCGCGCGC GCGGCTTTCA CCGGGTGGCC ACGGCGCCGC TGACGCCGCC CCGGCGCTTT 
GCCGCGTACC GCGCGTGGCT CGCCCAGGAT ATGCACGGCG GCATGGGCTA CATGGCCGAG 
GACGCGCACA TCGCCGGCCG CGCCGAGCCC GCCAGCCTGC TGGCCGAGGC CCGCTCGGTG 
GCGATCGTGG CCCTGGCCTA CCCGGCCGAG GACGGGCCCG GCGCGCCAGA CGCGCCAGAC 
GCGCCAGACG CGAGCGAAGC GGACGCGCCG CCGGGGGACG AGGACGGCGT GATCCGCGGC 
TTCGTGGCCC GCTACGCGCG CGGTCGCGAC TATCACAATG TGCTCAAGGA GCGATTGTTT 
GCGCTGGCCG AGGAGCTGGC CGAGGCCGTG GGCGCGCCGG TGGCCGCGCG CCCGTGCGTG 
GACAGCGCGC CGGTGCTCGA GCGCGACCTG GCCGAGAGCG CGGGCCTGGG CTTCACCGGC 
AAGAACACCA TGCTGATCAC GCCGGGCCTG GGCTCGTACA CGGTGCTGGG CGAGCTGCTG 
CTGGCGGCCG AGGTGGCGCC GACGCTGGTC CAGGTGTCCG AGAACAAGCA GCGCTGCGGC 
TCGTGCCGGG CGTGTCTGGA CGCCTGTCCT ACCAACGCGT TTCCCGCGCC CTTTGTGCTC 
GACGCCCGGC GCTGCGTCTC GTACCTGACC ATCGAGCACG AGGGCGCCAT CCCGCTGGCG 
CTGCGCCCGG GCCTGGGCAC GCGCATCTTC GGCTGCGACG TGTGCCAGGA GGTGTGTCCC 
TTCAACGCCC GGGCGCCGGC GCGCACGCCG GCCGATCCCG AGCTGTCGGC GGCGGCCGCG 
CCCGCAGCCC GCGGCACCGG CCCGGCGGCG GCGGTGGGTC CGCGCGCGGC TCCCGATCTC 
GTGCGCCTGC TCGGCCTGGG CGCCAATCAG CGCCGCCGCT ACGTCGACGG CACGGCCATG 
CGCCGCGCCA GTCGCGAGCG GCTGTCGCGC AATGTCTGCG TGGCCCTGGG CAACGCCGGC 
GATGTCCGCG CTATCCCGGC GCTGCTGGGC GCGCTGGCCG AGCGCAGCCC GGTGGTGCGC 
GCGCACGCGG CCTGGGCCCT GGGTCGCCTG GGCGCGCGCG AGGAGCTGCG CGCCGCGCTC 
GCGGACGAGA CCGAGGCCGA GGTCCGAGCC GAGATGCGCG CGGCGCTCGA CGCGCTGGCC 
TCGGGCGGCG ACGCGCTGGC CGACGCGGGC GGCGACGCGC ATGCGGGTGC CGGCAACGGC 
GCGGACGAAG ATCGCTGA

Protein sequence

MSPDAGETRP ERLRELLVRG ARARGFHRVA TAPLTPPRRF AAYRAWLAQD MHGGMGYMAE 
DAHIAGRAEP ASLLAEARSV AIVALAYPAE DGPGAPDAPD APDASEADAP PGDEDGVIRG 
FVARYARGRD YHNVLKERLF ALAEELAEAV GAPVAARPCV DSAPVLERDL AESAGLGFTG 
KNTMLITPGL GSYTVLGELL LAAEVAPTLV QVSENKQRCG SCRACLDACP TNAFPAPFVL 
DARRCVSYLT IEHEGAIPLA LRPGLGTRIF GCDVCQEVCP FNARAPARTP ADPELSAAAA 
PAARGTGPAA AVGPRAAPDL VRLLGLGANQ RRRYVDGTAM RRASRERLSR NVCVALGNAG 
DVRAIPALLG ALAERSPVVR AHAAWALGRL GAREELRAAL ADETEAEVRA EMRAALDALA 
SGGDALADAG GDAHAGAGNG ADEDR