Gene Hoch_0437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_0437
Symbol
ID	8542817
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	600223
End bp	601371
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	70%
IMG OID	646385234
Product	Alkanesulfonate monooxygenase
Protein accession	YP_003264971
Protein GI	262193762
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.137537
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATCG ATATTCGCAC CCCCGACGCC GCCGTCGAGA TGGCCTGGTT CGCCGATCTC 
TGCAACGGCG ATTACGAGCT GCTCGGCGTG CCCGAGAGCG CGCTGCGCAG CAACTTCACG 
CACTGCGCCG ACATGGTCCG CACCGCCGAC CGGCTCGGCT ACCAGAACAT CCTCTTGCCG 
TCCTCGTACC AGGTCGGCCA GGACACGCTC AGCTTCGCCG CCGGCGTCGC GCCCATGACC 
GAGCAGATCA GCCTGCTCAC GGCCGTGCGC ATGGGCGAGG TGCATCCGCC CATGCTGGCG 
CGCGCGCTGT CCACGCTCGA CCACATGCTC GCCGGCCGGC TCACGGTCAA CATCATCTCC 
TCGGACCTGC CCGGCACCCA GGCGCCCTCG GCGGAGCGCT ATCGCCGCGC CAGCGAAGTC 
GTCGCCATCC TGCGCCAGGC CTGGACCCAG GAGCGCATCG CCTTCGAGGG CGAGTTCTAC 
CAATTGGATC TGCCCAGCGA GCCGGTCGCG CCGTATCAGC AGAACGGCGG CCCGCTGCTG 
TACTTCGGCG GCATCTCGGA CGGCGCGCGC GCGCTCTGCG CCGAGCACTG CGACGTGTTC 
CTCATGTGGC CCGAGACCGA GGCCCAGCTC CGCGCGACCA TGAGCGACAT GAGCCAGCGC 
GCGGCCGCCC ACGGGCGCCG CATCGACTTT GGCTACCGCG TGCACGTGAT CGTCCGTGAG 
TCCGAAAACG AGGCCCGCGC CGCCGCCCGG CGCCTGGTCT CGCAGCTCTC GGACGAGCGC 
GGCGCCGAGC TCAAGCACCG CTCGCTCGAC TCGCGCTCGG CCGGCGTGCA GCGCCAGGAT 
GTGCTGCGCG AGCACGCCGA CGACGAGGGC TACATCGAGG ATCACCTGTG GAGCGGCATC 
GGCCGCGGTC GCTCGGGCTG CGGCAGCGCC ATCGTCGGCG ACCCCGACCA GGTGTACGAA 
AAATTGCAGC GCTACGTCGA TATGGGCGTG CGCGCCTTCA TCCTCTCGGG CTATCCGCTG 
ATCGACGAGT GCGAGCTGTT CGCGCGCTAC GTGCTGCCGC GCATGCGCAC CACGCGTCTG 
GCCCGGGTCC AGGGGCGGCT GCCCGAGCAC ACGCCCGAGA CCCCGCTGAC CACGGCCCCG 
CGCCGCTGA

Protein sequence

MNIDIRTPDA AVEMAWFADL CNGDYELLGV PESALRSNFT HCADMVRTAD RLGYQNILLP 
SSYQVGQDTL SFAAGVAPMT EQISLLTAVR MGEVHPPMLA RALSTLDHML AGRLTVNIIS 
SDLPGTQAPS AERYRRASEV VAILRQAWTQ ERIAFEGEFY QLDLPSEPVA PYQQNGGPLL 
YFGGISDGAR ALCAEHCDVF LMWPETEAQL RATMSDMSQR AAAHGRRIDF GYRVHVIVRE 
SENEARAAAR RLVSQLSDER GAELKHRSLD SRSAGVQRQD VLREHADDEG YIEDHLWSGI 
GRGRSGCGSA IVGDPDQVYE KLQRYVDMGV RAFILSGYPL IDECELFARY VLPRMRTTRL 
ARVQGRLPEH TPETPLTTAP RR