Gene Hoch_5597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5597
Symbol
ID	8548011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7682424
End bp	7683539
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	69%
IMG OID	646390270
Product	Rhomboid family protein
Protein accession	YP_003269972
Protein GI	262198763
COG category	[R] General function prediction only
COG ID	[COG0705] Uncharacterized membrane protein (homolog of Drosophila rhomboid)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCCTGC CCATCGGAGA CGAGCCCAAC GCTCCGCGCA CGCCCGTCGT CACCTACGCG 
CTGCTCGGCA TCAACATCGC CGTGTACCTG TTCATCACCC TGCCCATGGG CAGCGATTCG 
GCCGAATACC AGCGTGTGGC CGAAAGCTGG GGCTACCGCG CGGCCGCGCC CTCGCCGCTC 
ACCCTGCTCA GCTCGATGTT CCTCCACGCC GACATCTGGC ACCTGCTCGG CAACATGCTG 
TACCTGTGGA TCTACGGCGA CAACGTCGAA CATCGCCTGG GCCCGCTCGG CTACATCGGC 
GTGTACCTGG CCGGCGGCGC CGTGGCCACG CTGAGCTACG CGGCCTTTCT GTCGCCGGCG 
CTGATGGAGC TGCCGCTCGT CGGTGCCTCC GGCGCCATCT CCGCGCTGCT CGGCTTCTAC 
TTCGTGTGGT TCCCCAAGAA CCGCGTGCGC GTGTTCATCC TGTTTCGCGT GTGGCGCATC 
CGGGCGCCCA TCGTGCTCGG CATCTACGTG CTCTGGGACA ATGTGCTGCC GCTCCTGATC 
ACGGCCAGCA GCGACGGCGT GGCCTACGGC GCCCATCTCG GCGGCTTCTT CGGCGGCGTC 
ATCGGCGCGC TGCTCATCAG CTTCTTCGGC GAGCGCAAAT TCCAACACGG ACACCTGTCC 
GAGCAAGCGG TCAATGAGCT GCGCGAGCAC CCGCCGCAAC AGCTCGCCGC CGACGCCGCG 
CCCGCGACTG CCAAGAGCGT GTCCGCGCTC GCCAGCAGCA ACCCCGAGGC CGCCATGCTG 
CTCTACGAGA CGCTGAGCCC GAGCGAGCGC CAACGCGTCC CCGCCGAGCT GCTCGACGAC 
ATCGCCGACG AGCTGGCCAG CCACGGCGAA CACGAGGCCG CGCAGGCGCT CTACCATCGG 
GTCGCCGCCC AGCAGCCCGG CTCGCAGGCC GGCGTCCGCG CCATGCTGGC CATCGGCCAC 
TACTTTCGCG ATATCGGCCA CCCCGCGCGC GCCTATCAAT ACTACTACGC CATCGCCAAA 
CACGACCCGC GCTCGCCGCT GGCCGAGCAG GCGCGCCAGG CCATGCTCGA TCTCGAGCAC 
CATCATCGCC GCACAAACGC GCGCCGAGCG CCCTGA

Protein sequence

MFLPIGDEPN APRTPVVTYA LLGINIAVYL FITLPMGSDS AEYQRVAESW GYRAAAPSPL 
TLLSSMFLHA DIWHLLGNML YLWIYGDNVE HRLGPLGYIG VYLAGGAVAT LSYAAFLSPA 
LMELPLVGAS GAISALLGFY FVWFPKNRVR VFILFRVWRI RAPIVLGIYV LWDNVLPLLI 
TASSDGVAYG AHLGGFFGGV IGALLISFFG ERKFQHGHLS EQAVNELREH PPQQLAADAA 
PATAKSVSAL ASSNPEAAML LYETLSPSER QRVPAELLDD IADELASHGE HEAAQALYHR 
VAAQQPGSQA GVRAMLAIGH YFRDIGHPAR AYQYYYAIAK HDPRSPLAEQ ARQAMLDLEH 
HHRRTNARRA P