Gene Hoch_3656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3656
Symbol
ID	8546046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	5031589
End bp	5032794
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	65%
IMG OID	646388325
Product	tail sheath protein
Protein accession	YP_003268051
Protein GI	262196842
COG category	[R] General function prediction only
COG ID	[COG3497] Phage tail sheath protein FI
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.175288
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0120421
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACCA GTTATCTCTC ACCCGGTGTC TATGTAGAAG AGGTCGACCG CGGCTCGAAA 
CCGATCGAAG CTGTCGGAAC CAACACCGTC GGCTTCATCG GCGAGTCTGC CAAAGGCCCC 
ACGAACGAGG CGGTCCTGGT CACGAACTGG TCGCAGTTCG TCAAGACCTT CGGCGACTTC 
AAGGACTGCT CGATGCACCT GGCGCACGCG GTCTACGGCT TCTTCAATAA CGGCGGTTCG 
CGTTGCTTCG TTGTCAACTG CGGCGCGCCG GACGAAGAAG AAGTGAGCGC CACGGCCAGT 
GCCGGAGACA AGAAGGACGA CAAGCCCAAG ACCGCCTCGC GCGGTGACCG CGACGGCCGC 
TTCATCGGTC GCGACAACGG TCCGGGTCAG CGTTCGGGTC TCAAGTGCTT CGAGGAGATC 
GACGAGATCG CGATCCTCTG CGCCCCCGGT CAGGTTTCGC CCGCCGTCCA AGACGCCGTG 
CTCACGCACT GCGAGACCCG CAAGGACCGC TTCGCGATCC TCGACTCGCC CGAGACCATC 
TCGGGTGGCG TCGACCGCCT GCCCAAGCCG CGCGACTCGA AGTACGGCGC CTACTACTTC 
CCGTGGATCC AGGTCTACGA CCCGGACAAG GGCAACCTCT TCGTGCCGCC CTCGGGTCAC 
ATCGCCGGCG TCTACTCGCG CGTGGACAAC GAGCGCGGCG TGCACAAAGC TCCGGCCAAC 
GAGCTGGTGC GCGGTGCCCT GGGCCTCAAG TACAACGTGT CGAAGGGCGA GCAGGACCTG 
CTCAACCCCA AAGGCATCAA CGCCATCCGC ATGATGAACG GCGGCATTCG CATCTGGGGC 
GCGCGTACGC TGTCCTCGGA TCCGTCGTGG AAGTACATCA ACGTCCGGCG TCTGTTCATT 
ATGGTGGAGT CGTCGATCGA GCGCGCGACC CAGTGGGTCG TATTCGAGCC CAACGATCAT 
CGCCTCTGGA AGCGCGTGGT GCGGACGATC TCGTCGTTCC TCACCCTGCT GTGGCGCAAC 
GGCGCGCTCA TGGGCACCTC GCCCGAGCAG GCCTTCTTCG TCAAGTGTGA CGACGAGACC 
AACCCGCCCG AGGTCGTGGA CGCCGGCCAG CTGGTCGTCG AGATCGGCCT CGCCCCGGTG 
AAACCGGCCG AGTTCGTCAT CTTCCGCATC GGCCAGATGC CCTCTGGCGG CGGCGTCGAA 
GAGTAG

Protein sequence

MATSYLSPGV YVEEVDRGSK PIEAVGTNTV GFIGESAKGP TNEAVLVTNW SQFVKTFGDF 
KDCSMHLAHA VYGFFNNGGS RCFVVNCGAP DEEEVSATAS AGDKKDDKPK TASRGDRDGR 
FIGRDNGPGQ RSGLKCFEEI DEIAILCAPG QVSPAVQDAV LTHCETRKDR FAILDSPETI 
SGGVDRLPKP RDSKYGAYYF PWIQVYDPDK GNLFVPPSGH IAGVYSRVDN ERGVHKAPAN 
ELVRGALGLK YNVSKGEQDL LNPKGINAIR MMNGGIRIWG ARTLSSDPSW KYINVRRLFI 
MVESSIERAT QWVVFEPNDH RLWKRVVRTI SSFLTLLWRN GALMGTSPEQ AFFVKCDDET 
NPPEVVDAGQ LVVEIGLAPV KPAEFVIFRI GQMPSGGGVE E