Gene Hoch_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2034
Symbol
ID	8544416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2804367
End bp	2805410
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	67%
IMG OID	646386737
Product	NMT1/THI5 like domain protein
Protein accession	YP_003266472
Protein GI	262195263
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.599976
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.2602
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGCTGC TGGCGCTGGC CACCGCGTTG GCGGCGCCCG GGTGCAAGAG CTCGGAGTCC 
GGTGGCTCGG CCGAGTCTGC GGACAAGGGC AGCGAGGCGG GCGAGGGCGC AGCGGGCGCG 
GCCAAGAGCG CGGCCAAGAC CGAGGCCAAG ACCGAGGCGG TGACGCTGCA GCTCAACTGG 
GTGCCCGAAC CCGAGTTCGG CGGCTTCTAC GCGGCCAAAC ACAGCGGCGG CTACGAGCGC 
GCCGGGCTCG ATGTCGACAT CGTGGCCGGC GGCGCCGGCG TGCCGACCTG GAACATGGTG 
GCCGCGGGCA AGGTGCCCTT TGCCATCGCC TCGGGCGCCG AGATCCTGCG CGCGCGGCTG 
CAAGATGCGC CCGTGGTGGC CCTGTACGCG GTGTACCAGA CCAATCCGCA GGCGCTGATG 
GTGCACGCCG ACAGCCCGGT GGAGTCGCTC GAGGAGGTGT TTCTCTCGGG CGCGATCGAG 
CGCGTCATCA TGGTCGCCGG GCTGCCCTAC GTCGAGCATC TGAAGCAGAA GTACGGCTTC 
GACAAGGTCG AGATTGCCCA GTATGGCGGC AACCTGTCGC TGTTTTTGCC GGACAAGAAG 
GCGGCACAGC AGTGCTTCAT CTTCTCCGAG CCGGTCACGG CCCGAGAGCA GGGCGTGGAG 
GTCAAGGCCT TCTCGGTGGC CGAGAGCGGT TTCAACCCCT ACCTGGCCGT GCTCATCACC 
AGCGAGGCGC ACATGAAGGA GCACCCCGAG CAGGTCCAGG CCTTCGTCGA GGCTACCCGC 
GCAGGCTGGC AGATGTATCT CGAGGATCCC AAGCCGACCA ACGAGTACAT GAAGCAGCAG 
GGCGCCTCGA TGAGTATGGA GGCCATGAAT TTCGCGGCCG AGCTGCAGAC GCCGTACATC 
GTCTCGGACG AGACCAGCGA GCACTATCTC GGCTACATGA GCGCCGAGCG CTGGAGCGAG 
CTGGCGCAAC AACTGCTCGC GCTCGAGGAG ATCGAGTCGA TCCCGGACGT GACGACGCTG 
TTCCATAACG CCGCCGCCAG GTGA

Protein sequence

MLLLALATAL AAPGCKSSES GGSAESADKG SEAGEGAAGA AKSAAKTEAK TEAVTLQLNW 
VPEPEFGGFY AAKHSGGYER AGLDVDIVAG GAGVPTWNMV AAGKVPFAIA SGAEILRARL 
QDAPVVALYA VYQTNPQALM VHADSPVESL EEVFLSGAIE RVIMVAGLPY VEHLKQKYGF 
DKVEIAQYGG NLSLFLPDKK AAQQCFIFSE PVTAREQGVE VKAFSVAESG FNPYLAVLIT 
SEAHMKEHPE QVQAFVEATR AGWQMYLEDP KPTNEYMKQQ GASMSMEAMN FAAELQTPYI 
VSDETSEHYL GYMSAERWSE LAQQLLALEE IESIPDVTTL FHNAAAR