Gene Hoch_3578 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3578
Symbol
ID	8545968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4930355
End bp	4931731
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	76%
IMG OID	646388247
Product	cytochrome c family protein
Protein accession	YP_003267973
Protein GI	262196764
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.628183
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0456283
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATGG GAACCACTCG CAAGCGCGAT ACAGCGCGCG CGCTGGCGCC GCTCTTTGCC 
TTCGCGATCG CGCTGGGGCT GGCGGCCGCG GCCCTGGCGC AGCCCGAATC GCAGCCCGCG 
GGCGAGCCCG CGCGCGATCC GGCCCAGCCG GCGCCAGCGC TGTTTCCCGC GCCGCTGCCG 
CCGGCGCTCG CGCCCGACGC GGTGCCGCCG TCAGACCCGG CCGCAACGCC GGCAGCGGAC 
GCGGCCGGGG ACGGCGTCTC GCCCGTGATC TACCCGCCGC AGGAGCTGCC GCTCTACTTC 
TCGCACGCGG CTCATCTGCG TCTGCCCGAG GCGCCCGCGT GCCTCGACTG TCACCCGCGC 
GCCGCCTCCT CGATGTCGTC CATCGACGAT CTGATGCCGC GCGAGGCCGC GTGCCGGCCG 
TGCCACGCCA TCGATCGCGA CCAGCCCACC AAGGCCGTGG CCGCGGGCGC GCCGGCCGCG 
CGCTGCGACG CCTGCCATCC GGGCTACGCG CCCGGCGATG TCGCGGTCGC GCGGCTGCGG 
GTGCCGGTGC CCAACCTCAA GTTCCCGCAC CGCGTGCACG TCGCCCGCGG CCAGGCCTGC 
ACCGGCTGCC ACGGCGACCT GGCGGCCGAG GGCGTGGCGC TGGCGACCCG GGCGCAGCTC 
CCCGCGATGC GCTCGTGCCT GGCCTGTCAC GACGACCGCC AGGCCGCGCG CGCGTGCACC 
ACCTGCCACC TGGCCGACGC CGGCGGCTTC GTGCGCACCC GCTTCGCCGA GGGCGCGCTC 
ATGCCCTCGG GCACGCTGCG CGGCGCCGCC CACGATCTGA GCTTCCGCAG CGCGCACGCC 
GGGGCCTCGC GCAGCGACCC CGACTACTGC GCGAGCTGCC ACCAGCAGTC GTTCTGCGTC 
GATTGCCACG ACGGCGCGTT CAAGCCCATG GACTTCCACG GCGGCAACTA CGTGGCCCTG 
CACGCCATCG ACGCGCGCCG CGACGCCAAC GAGTGCAGCG CGTGCCACCG CGCCCAGAGC 
TTCTGCACCG GCTGCCACAG CCGCTCGGGC GTGAGCGCCG ACGGCCGCGG CTCCGAGTTC 
GACGCCGAGC AGCCCGGCCG CGGCTTTCAT CCGCCCGGCT GGTCGCGGCC CGGCCTGGTC 
GGCCCCGGCC ACCACGGCTT CGCCGCCCGG CGCAACATCG AGCAGTGCGC GAGCTGCCAC 
CGCGAAGAGG ACTGCGTGGC CTGCCACAGC GGCAGCCCGA TGGGCGGGAT CTTCGGCGTC 
AGCCCGCACC CGCCGGGCTG GGCCACGAGC CGGCGCTGCC GCGTCCTGCT GTCCAAAAAC 
CCGCGCGTGT GCCTGCGCTG CCACATCGAT CGCGCCGAGC TGCGCTGCGC GCCCTGA

Protein sequence

MAMGTTRKRD TARALAPLFA FAIALGLAAA ALAQPESQPA GEPARDPAQP APALFPAPLP 
PALAPDAVPP SDPAATPAAD AAGDGVSPVI YPPQELPLYF SHAAHLRLPE APACLDCHPR 
AASSMSSIDD LMPREAACRP CHAIDRDQPT KAVAAGAPAA RCDACHPGYA PGDVAVARLR 
VPVPNLKFPH RVHVARGQAC TGCHGDLAAE GVALATRAQL PAMRSCLACH DDRQAARACT 
TCHLADAGGF VRTRFAEGAL MPSGTLRGAA HDLSFRSAHA GASRSDPDYC ASCHQQSFCV 
DCHDGAFKPM DFHGGNYVAL HAIDARRDAN ECSACHRAQS FCTGCHSRSG VSADGRGSEF 
DAEQPGRGFH PPGWSRPGLV GPGHHGFAAR RNIEQCASCH REEDCVACHS GSPMGGIFGV 
SPHPPGWATS RRCRVLLSKN PRVCLRCHID RAELRCAP