Gene Hoch_3969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3969
Symbol
ID	8546365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5469768
End bp	5471180
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	72%
IMG OID	646388641
Product	peptidase domain protein
Protein accession	YP_003268361
Protein GI	262197152
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0213029
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.430474
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTGCGGCC TGGGCGCGTG CCTGAGCCTG CTGGCGCTCG GCGCCTGCGA CAAGCGTACG 
GGCACCGCCA AGCACATCCC GCGCGATGAC GACGCGCTGC CGGTCGTGGT GGTCGACGAG 
GTCGCGAGCG CGACCGCGAC CATCGACGAG GTCGAGCCCA ACAACGAGCG CGCGCAGGCC 
ACAGAGGTCG CGCTCGGCGA GGCTGGCAAA GGCGTGCTCG ACGGCGAAGA AGACGTCGAT 
TTCTATCGGG TCGCCGTGGC CTCGGCCGAT GTCTTGAGCG TGCGGCTGAG CGGCATCGAG 
GCGGTCGACC TGATGCTCGA GCTGCAGGAC CAGGGCGGCG AGGTGCTGGC CCGCTCCGAC 
CGCGGCCCGG CGGGCACGCT CGAGGGCATA GCCAACTTCT ACGTCGAGCC CGGGAGCTAC 
TTCCTGGCGG TGCGCGAGTT CGTGCCCAAG CGGCGCAAGC GCAAAGGCGA GCCGCGCACC 
GGTCCATCGC CCGCGTACAC GCTCGAGCTC GCGCGGCTGA GCGAGATCGC CGAGACCCAG 
GAGCGCGAGC CCAACCAGGA CGTCGAGGGC GCGCGCGAGC TGCTGGTCGG CGACGAGGGC 
AGCGGCTTTA TCGGCTGGGG CGGCGACGTC GATCTGTGGA AGCTGCCGGT CGAGGGCTTC 
ACCGAGCAGT ACAGCCTGGA TCTCGACCTC ACCGGCGTGC CCGCGGCGAC GCTCACGCTG 
GAATTGCTCG ACAGCGGCGG CTCGGTGATC CTCAAGCGCA CGGGCGCCGC TGACAGCGCG 
CTGGCCGTGC GCAACCTGGT GCCGGAGTCC GCCGGCGACG ACGCCACCGG GCCGACGCAG 
CACACCTACT ACGCGCGCAT TTCGGCGCGC CGCTCCAATC CCGTGGATCC CTACCTGCTG 
CGCGTGAGCT CACACCTGCT CGACCTCAGC GACGAGCGCG AGCCCAACGA CGTGGCCGCG 
CAGGCCTCGT CGCTGCTCGG GGTCGATCCC GGACAGACGG CCGACAGCCG CTCGGGGCGC 
GTGACCGGCA CGCTCACGGT TGGCGATACC GACGTGTTCA GCCTGCCGGC GCAGGGCGAG 
GCGGTCGCGC TCACGGTCGA GCTGGTGCCG CGCGAGGACC TCGACGCCAC GCTCACCGTG 
CTGAGCAACG GCGAGACCCG GGCCATGGCC AACGCCAACG GCAAGGGCGG CAAGGAATAC 
CTGGCCGATG TGCGCATCGA CGCCGGCGCG TCGGCGGTGG TGCAGATCTC GGGCGAGGGC 
GCGCTGGGCG AGGGCGCCGG GTACCTGCTG AACTGGTCGC TCGCGACCGC ATTCGAGCCC 
CCGCAAGACA CCCTCGACAG TACCTGGGGC GAGCTGCCGC CGGAGCTGGG CGGCGACGCG 
GCTGGGTCGG GCGATGACTT TCGCGGAGAC TGA

Protein sequence

MCGLGACLSL LALGACDKRT GTAKHIPRDD DALPVVVVDE VASATATIDE VEPNNERAQA 
TEVALGEAGK GVLDGEEDVD FYRVAVASAD VLSVRLSGIE AVDLMLELQD QGGEVLARSD 
RGPAGTLEGI ANFYVEPGSY FLAVREFVPK RRKRKGEPRT GPSPAYTLEL ARLSEIAETQ 
EREPNQDVEG ARELLVGDEG SGFIGWGGDV DLWKLPVEGF TEQYSLDLDL TGVPAATLTL 
ELLDSGGSVI LKRTGAADSA LAVRNLVPES AGDDATGPTQ HTYYARISAR RSNPVDPYLL 
RVSSHLLDLS DEREPNDVAA QASSLLGVDP GQTADSRSGR VTGTLTVGDT DVFSLPAQGE 
AVALTVELVP REDLDATLTV LSNGETRAMA NANGKGGKEY LADVRIDAGA SAVVQISGEG 
ALGEGAGYLL NWSLATAFEP PQDTLDSTWG ELPPELGGDA AGSGDDFRGD