Gene Hoch_1953 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1953
Symbol
ID	8544335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2691640
End bp	2692851
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	66%
IMG OID	646386657
Product	hypothetical protein
Protein accession	YP_003266392
Protein GI	262195183
COG category	[S] Function unknown
COG ID	[COG4399] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.577972
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.120889
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACTTCA GCTTGCAAGA CCTCTTGGTT CTGCTGATCC CCGTCGTGAG CGCGGTGGTC 
GGCTGGGCGA CCAACGTGGT GGCGATCAAG ATGATGTTCT ATCCGGTGGA CTTCGTCGGC 
GTGTGGAAGC TCGGCTGGCA GGGCATCGTG CCGGCCAACG CCACCCGCAT GGCCTCGGCC 
TCGACGCAGA TCATCACCGA GAAGCTGCTG CGGCTCGACG AGCTGTTCGC GAACTTCGAC 
GCCGAGCACT TCACCGGCGC GCACCTCGAA GAGGTCATGG ACGAGACCGT CGAGCAGGTG 
ATCGAGGAGA CCGCGGCCAA GTACGCGCCC GAGATGTGGG CCGGCGCGCA GGAGGCTGCC 
AAGGGCCACG TGCGCCAGAT GGTGCGCGCC GATGTCGAGC GGGTGCTCAG CGAGATCCTG 
GCCGAGGTCG GCACGCAGAT CGAGGACATC CTCGACCTCG AGGCCATCGT GGTCGATACC 
GCCGAGCGCG ACCGCGCCAT CATCGGCGAG ATGTTCCAGA CCGTGGGCGC CAAGGAGTTC 
GACTTCATCC GCCGCTCGGG CGGCTACTTC GGCTTCCTCT TCGGCCTGGT GCAGCTCGGC 
GCGTGGCTGC TGTGGCCCGA GTGGTGGCTG CTGCCCACCT TTGGCTTCTT CGTCGGCTAC 
GTGACCAACT TTCTGGCGCT CAAGCTCATC TTCGAGCCGG CCGAGCCCAA GCGGATCGGG 
CCGTGGACGC TGCAGGGCCT GTTTCACAAG CGCCAGGCCG TGGTCGCCGA GGAGTTCTCC 
AAGATGGTGT CGCGCGACAT CCTCAACCCG GAGAACATGG TCAGCAAGAT GATCTCGGGG 
CCGGGCGGCG ACAAGCTGTT CGCCATCGTC ACCCGCCACG TCGATGCCCT GGTCACCCGC 
TACGCGCAGA ATCCGCTCAT CGGCGCCATG ATCCCGGCCG ACAAGTGGGA CGAGGCGCGC 
GTCGAGCTGC ACCGCCGCCT GCGCGAGGAG CTGCCCAAGC CGGGCGGCTT CCTGCACGTG 
TTCGCGCGCG AGGCGGTCGA CATCTACAGC GAGCTGGTCG AGCGCATGGT CGATCTCGAC 
GCCAAGAGCT TCGAGGGCAT CCTGCGGCCG CCCTTCCAGC AGGATGAGTG GAAGCTGATC 
ATCGCCGGCG GCGTGCTGGG TCTCGGCGCC GGTCTGCTGC AGCTCCTGTA TCTGCTCGGC 
GAATCCGTGT AG

Protein sequence

MNFSLQDLLV LLIPVVSAVV GWATNVVAIK MMFYPVDFVG VWKLGWQGIV PANATRMASA 
STQIITEKLL RLDELFANFD AEHFTGAHLE EVMDETVEQV IEETAAKYAP EMWAGAQEAA 
KGHVRQMVRA DVERVLSEIL AEVGTQIEDI LDLEAIVVDT AERDRAIIGE MFQTVGAKEF 
DFIRRSGGYF GFLFGLVQLG AWLLWPEWWL LPTFGFFVGY VTNFLALKLI FEPAEPKRIG 
PWTLQGLFHK RQAVVAEEFS KMVSRDILNP ENMVSKMISG PGGDKLFAIV TRHVDALVTR 
YAQNPLIGAM IPADKWDEAR VELHRRLREE LPKPGGFLHV FAREAVDIYS ELVERMVDLD 
AKSFEGILRP PFQQDEWKLI IAGGVLGLGA GLLQLLYLLG ESV