Gene Hoch_3229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3229
Symbol
ID	8545617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4448348
End bp	4449574
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	66%
IMG OID	646387896
Product	hypothetical protein
Protein accession	YP_003267624
Protein GI	262196415
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0914221
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.650487
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTCGT TCGACAGTCA TCGCCTCAGC CGCATCCTGC CCCTGCGGGT GCGCAATCAG 
CTCGACGCCT ACTGGGAGAT GCTCGGCCTG GTGCGCGAGA TCAACAACCC GCGGGTGCTG 
CGCGCGCTCG GGCCCTCGGG GCTGCGCGGC CTGCTCTTGC GCCGCGGCAA GCAGAACGTG 
CCCAGCAACT TCCAGGCCCG TCACAAGGCC CACTTCAACT GGTCGTATCC CAGCGACAAC 
GGCGAGATGG CCGAGCTGTA CGCGCGCGCC AAGCAGGGCC AGTGGGACGG CGACAGCTAT 
CTGCCCTGGG ACATCGATGT CGATCCCGAA AACCCCGAGC GCGCGATCAT TCCCGAGCAG 
TTTTTCGCCT TCGAGCTGCT CGCCGAGTTC GGCGTACGAC TGTCCGAACG CGAGCGGCGG 
CAACTGCTGC ACAGCATGGC GGCGTGGATG CTCAGCCAGT TCTTGCACGG CGAACAGGGC 
GCGCTGATGG CGGCCGCCCA GGTCACCGAG GCGGTGCAGT TCTTCGACGG CAAGCTCTAC 
GGCTCGACCC AGGTGGTCGA CGAGGGCCGC CACGTCGAGG TGTTTCACCG CTACCTCGAC 
ACCAAGCTCG AAAAGCTCTA CCAGATCAAC GACAACCTGT TCGTCATCAT CGACGCGCTG 
ATGGAGGACA GCCGCTGGGA CATGAAGTTC CTCGGCATGC AGATCATGGT CGAGGGGCTG 
GCCCTGGGCG CTTTCGGCGT GCTGTACCAA AACACCCGCG AGCCGCTGCT CAAGGAGCTG 
TTGCGCATGG TCATCCAGGA TGAGGCCCGG CACGTGCACT ACGGCGTGCT GGCGCTGCGC 
GAGCATTTCC GCGAGGCGCT GAGCGAGCGC GAGCGCATCG AGCGCGAGGA CTGGGCCTTC 
GAGGTGGCGC TGCTGATGCG CAATCGCTTC ATGGCCTACG AGGTGTACGA GGAGTGGTTC 
GAGGGCAGCT TCAGCCGCGA CCAGTGGCGC CGCTTCGTGG CCGCGTCGCC CGGCTTCGAG 
CAGTTCCGCC ACGTCATGTT CAACCGCCTG GTGCCCAATC TGCGCGAGAT CGGGCTGATG 
TCGCCGCGCA TCCAGGAGCA CTACGCCGAG GTCGACCTGA TGAAATACTT CGGCAACGCG 
GCCGCGGACC AGCTCTCGGG CGAGCAGCTC ATCCACGAGC TCGACGCCAG CGCGCCCAAG 
GACACACTCG GCGTCGCCAC AGCGTAG

Protein sequence

MFSFDSHRLS RILPLRVRNQ LDAYWEMLGL VREINNPRVL RALGPSGLRG LLLRRGKQNV 
PSNFQARHKA HFNWSYPSDN GEMAELYARA KQGQWDGDSY LPWDIDVDPE NPERAIIPEQ 
FFAFELLAEF GVRLSERERR QLLHSMAAWM LSQFLHGEQG ALMAAAQVTE AVQFFDGKLY 
GSTQVVDEGR HVEVFHRYLD TKLEKLYQIN DNLFVIIDAL MEDSRWDMKF LGMQIMVEGL 
ALGAFGVLYQ NTREPLLKEL LRMVIQDEAR HVHYGVLALR EHFREALSER ERIEREDWAF 
EVALLMRNRF MAYEVYEEWF EGSFSRDQWR RFVAASPGFE QFRHVMFNRL VPNLREIGLM 
SPRIQEHYAE VDLMKYFGNA AADQLSGEQL IHELDASAPK DTLGVATA