Gene Hoch_1734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1734
Symbol
ID	8544116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2361890
End bp	2363737
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	64%
IMG OID	646386441
Product	hypothetical protein
Protein accession	YP_003266176
Protein GI	262194967
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00167071
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAAT GGAGATGGTT GTGTATGTTC GCGCTCGCGA TGCCGCTGTG GGCGTCGGGT 
TGCGCCTGGC TGGTTCTCGA GGAGCCGGCG TGCACTTCGG GCGAGACCTG TCCGGGCGAC 
TTCGTGTGCG ACCCGGCCAC CGGCCTGTGC CTCACCCCGT GTCCGCCCGG CAGCGAGCTG 
TGCGACGGCA TGTGCGTCAA TCCGCAGCAG AACAACAGCC ACTGCGGCGC CTGCGGCGAG 
GTCTGCGGCG ACGGCGAAGT GTGCGCAGCC GGCGAGTGCG CGGCCACCTG TGGGCCCGGC 
ATCAGCACCT GCGAGGGCGA GTGCGTGGAC ACCGACATCG ATCCCGCGCA CTGCGGCGCC 
TGCGGCAACG CCTGCGCGGC CGACGGCTAC TGCGTGGGCG GCGCGTGCGC GGCCACCTGC 
GCGCCCGGCA CCGAGCCCTG CGGCGGCATC TGCAGGGACA CCGCCAGCGA CCCGGACCAC 
TGCGGCGGCT GCGGCCTGAG CTGCGGCGAG GGCGAGCTGT GCGAGGCTGG CGCGTGCACC 
TGCCCGAGCG GACTCGACGA GTGCGCGGGC ACCTGCATCG ACTTCGACAG CGAGCCCGCG 
CACTGCGGCG CCTGCGGCAA CGCGTGCTTG GACGGCCAGA ACTGCGTCGA TGGCGCGTGC 
GCGTGCCCGG CCGGGACCAC CCTGTGCGGC GGCGCGTGCG TCAACCTCGA CACCGACGCC 
GAGCACTGCG GCGTGTGCGA AAACCAGTGC AGCAGCGGCA GCGCGTGCAG CGGCGGCGCG 
TGCGTGTGCG TTCCCGGACA GACGTACTGC GACGGCGCGT GCACCGACCT CGGCGACGAT 
GACGCGCACT GCGGCGCTTG CGGCAACGCC TGCGGCGGCG GCATGAGCTG CGAGGGCGGC 
GCGTGCGAGT GCCCGGCCGG CTTCACCGAG TGCGGCGGCG CGTGCAAAGA CCTCGAGCGC 
GACGTGCTCT CGTGCGGCTC GTGCGGTCAC GCTTGCGACT CGGGCAAGGC GTGTGTCGAT 
GGTCAGTGCG TGTCGCCGTT TACCGGTACT CGGACAGCGC TGCCACTGCC CAACGGTTGC 
TCGGCCTTTC CGCTATCGCC CGACGAGTGC GGCACGCCGA TCGCCACGGA GACAGTGCCG 
TTCGAATTCG ACGACCTTGA TGAGACAATT ATATATAATC CCGATGAGCC ATTTGCTAGC 
AACGAATCTC TCGTTTTATC GGGCGATGCG CGGTCGTTTG ATCATGGTGG TGCCCTAGGG 
TACGTTGGGT TTTTCGATGA GGGGGAGCAT TCACTCACGC AAAGGAGCAT TCTCGCAGGG 
TCTAGCTGGG GAGCTTTCTC TCTCGGTATC CGCTCCGGTA TTCGATCCTG TGCGCGCCCT 
TCGAGTCTCC GGTTCTGGGT TAGATTCCCT GTTCTAGATA TTGTCGCTAC TCTCGTTCGT 
ACTACCCTTA CAGGCAAATA TAACACCGGT GGAATAGGGT TTTTCGAGGC CACATCTTTA 
CAGATAAATC CAGAAACTGG TGAAACCTGT GACCAAGTGT GCGGCTATAT CTCAATGCGA 
TGCGATGACA CGCAGCAGTG GTACAGGGCG ACGATTCCCC CTCGTAAGAC CCTCGCTCTG 
GAGATCGCCT TACGCAGTAG TGGTAGTACC TACTTCAATG TCGCCGTATT TCGAACAGAC 
GAATCACAGA TTTTCCATGC GGCTAGTGGG AGCGTGGGCG GCTCCTACGG ATTCTACACT 
GCGAGGCTCA GGAACAACCT CGACATTCCC CAGGACGTCG TATTGAGCGT CATCCCATGG 
AACGGAGATG GTGTGCACTA TCAAATCGCG GCAGCGATAG AGCAGTAA

Protein sequence

MIKWRWLCMF ALAMPLWASG CAWLVLEEPA CTSGETCPGD FVCDPATGLC LTPCPPGSEL 
CDGMCVNPQQ NNSHCGACGE VCGDGEVCAA GECAATCGPG ISTCEGECVD TDIDPAHCGA 
CGNACAADGY CVGGACAATC APGTEPCGGI CRDTASDPDH CGGCGLSCGE GELCEAGACT 
CPSGLDECAG TCIDFDSEPA HCGACGNACL DGQNCVDGAC ACPAGTTLCG GACVNLDTDA 
EHCGVCENQC SSGSACSGGA CVCVPGQTYC DGACTDLGDD DAHCGACGNA CGGGMSCEGG 
ACECPAGFTE CGGACKDLER DVLSCGSCGH ACDSGKACVD GQCVSPFTGT RTALPLPNGC 
SAFPLSPDEC GTPIATETVP FEFDDLDETI IYNPDEPFAS NESLVLSGDA RSFDHGGALG 
YVGFFDEGEH SLTQRSILAG SSWGAFSLGI RSGIRSCARP SSLRFWVRFP VLDIVATLVR 
TTLTGKYNTG GIGFFEATSL QINPETGETC DQVCGYISMR CDDTQQWYRA TIPPRKTLAL 
EIALRSSGST YFNVAVFRTD ESQIFHAASG SVGGSYGFYT ARLRNNLDIP QDVVLSVIPW 
NGDGVHYQIA AAIEQ