Gene Hoch_3416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3416
Symbol
ID	8545804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4716202
End bp	4717338
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	73%
IMG OID	646388083
Product	amidohydrolase
Protein accession	YP_003267811
Protein GI	262196602
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.729562
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.139217
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCGC GCTTTGTCTC TTTGCCGCTT GGCGGTGTCG GCTGCTTCGG TTACAGGTCG 
AACATGCCCC CTCACTCGCG CCGCGGTCAC GTCAACGCTC ACACGCACAT CTACAGCGCC 
CTGGCGCCCT TCGATATGCC GGCACCGCAG CCGCCGCCCG AGAGCTTTTT GCAGATCCTC 
GAGCGGGTGT GGTGGCGTCT CGACCGCGCG CTCGACGAGC AGGCGCTGGC CGCGGGCGCC 
GACTACTACG TGGCCGAGGC GCTGATGGCG GGCACCACCT GCCTCATCGA TCATCACGAG 
TCGCCCAACT TCATCGACGG CTCGCTCGAT GTGCTGGCCG AAGCCTGCCA GCGCCTGGGG 
ATGCCGGCGG TGCTGTGCTA CGGCGCCACC GAGCGCAACC GCGGCCGCGA CGAGGCCCGC 
GCCGGTCTGG CCGAGTGCGA GCGCTTCCTG CGCACCAATG AGCGCCCGCT GGTGCGCGGC 
GCGGTCGGCC TGCACGCGTC GTTCACGGTC TCGGACGACA CCATCGGCGA GGCCGCGGCC 
CTGGCCCGCT CGCTGGGCGC GGTGCTGCAC CTGCACGTGG CCGAGGGTCC CGAGGATGTC 
GCCGACGCCC GCCGCCGCGG CGACGCCAGC CCGCTGGCGC GCCTGCGCCG GCTCGACGCG 
CTGGTGCCCG GGTCGATCCT GGTCCACGGC GTGTACCTCA CGGCCGAGGA GGTGGCCGAG 
TGCGAGCAGC GCGGGCTGTG GCTGGTGCAG AACCCGCGCT CGAACCGCGG CAACGGGGTC 
GGCTATCCCA GGGCGCTCAC GCACAGCCGG TGCGTGGCGC TGGGCACCGA CGGCTACCCG 
GCGGATATGA ACGACGAGGT CGCCGCGCTG TTCGCCGAGG CAGAGGAGGT CGAGGATGAA 
TCGCCGCGTC TGGGCAACCG CCTGGGCGCC GGCCACGCTC TGTGCGCGGC CCTGTTCGGC 
GGCGAGCCGC CCGAGGTCGA CGTCCACGAG CCCATGGGCA GCCCCGAGAT GCGCGTGGAC 
GTCGCCGGGC GCGAGGTGGT CGCCGGCGGC GAGCTGCTCA CCGGTGATCG CGCGGCCTTC 
GAGGCCCGCG CCCGGACCCA GGCCGAGCGG CTGTGGCAGC GCATGGCCGC GCTGTGA

Protein sequence

MSARFVSLPL GGVGCFGYRS NMPPHSRRGH VNAHTHIYSA LAPFDMPAPQ PPPESFLQIL 
ERVWWRLDRA LDEQALAAGA DYYVAEALMA GTTCLIDHHE SPNFIDGSLD VLAEACQRLG 
MPAVLCYGAT ERNRGRDEAR AGLAECERFL RTNERPLVRG AVGLHASFTV SDDTIGEAAA 
LARSLGAVLH LHVAEGPEDV ADARRRGDAS PLARLRRLDA LVPGSILVHG VYLTAEEVAE 
CEQRGLWLVQ NPRSNRGNGV GYPRALTHSR CVALGTDGYP ADMNDEVAAL FAEAEEVEDE 
SPRLGNRLGA GHALCAALFG GEPPEVDVHE PMGSPEMRVD VAGREVVAGG ELLTGDRAAF 
EARARTQAER LWQRMAAL