Gene Hoch_4979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4979
Symbol
ID	8547387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	6864530
End bp	6865558
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	71%
IMG OID	646389653
Product	cysteine-rich repeat protein
Protein accession	YP_003269361
Protein GI	262198152
COG category
COG ID
TIGRFAM ID	[TIGR02232] Myxococcus cysteine-rich repeat

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.734088
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACGA TGAGCGCTTC CATCCCGCGA ACCCGCGCCG TACTCGGCGC GGTGTTCGCC 
GTCGGCGCCA TGCTCGCGCT CGCCGGCTGT TTCAACCAGG GCACGCAGGC GACCGACTGT 
CCGACCGGCG TGACCTGCGC GCCCGGCTGG GAGTGCGCGG CTGCGCAGGC TGCGTGCATC 
CTCGACGGCT GCGGCAACGG CCGCGTGCAA TACGAGCGCG GCGAGGTCTG CGACGACGGC 
AACATCCTCG ACGGCGACGG CTGCAGCGCC GATTGCCTGT CCAACGAATC CTGCGGCAAC 
GGATATACCG ACGTGAGCGA GGACTGCGAC GAGGGCGACG ACGACCTGGT GTGCGACGGT 
GACTGCACCG TGCCCGTATA CGGCGACGGC GTGGCCGACA ACACCGCCGC CTGCGATCGC 
GACTGCAGCT TTCCGCGCTG CGGCGACGGT GTGTTCAACG AGTTTCACCT GGTGCAGCCC 
GATGACGGCG GCGCCGCGTA CCTGGAAGCG TGCGACGACG GCAACGACGA GAACCGCGAT 
GACTGTCTCG ACGTCTGCCT GGCCGCGCGC TGCGGCGACG GCTTCGTCCA CAGCTTGGGC 
GCCGGCGGCG AGACCTGCGA CGTCGACGTG GACGGCGACG GCGTGGCCGA CAACGTCGCC 
GCGTGCGACA GCGATTGCAC GGCGCCCGCG TGCGGCGACG GCGTGCACAA CGCCGCGGCC 
GGGGAAGCCT GCGACGATGG CAACGAGGAC GATGGCGACG CCTGCGTCAG CGGCTGCGCG 
GCCGCGCGCT GCGGCGACGG CTTCGTCTTC GAGGGCGAGG AGCTATGCGA CGACGGCAAC 
GCCAGCAACG GCGACGCGTG CCCCACGGGC AGCGGCGGGA GCTGCGAGCC CGCGCGCTGC 
GGCGACGGCT TCATCCAGGC CGGCGTCGAG CAATGCGACG TCGGCAACGG CGCCGTGGAT 
ACGTGTGCGG GCGGATCGGA ATGCCAGCCA CCAAATCTTC CCGGTGCTTG TTCTTGCCAA 
TTCACCTAG

Protein sequence

MATMSASIPR TRAVLGAVFA VGAMLALAGC FNQGTQATDC PTGVTCAPGW ECAAAQAACI 
LDGCGNGRVQ YERGEVCDDG NILDGDGCSA DCLSNESCGN GYTDVSEDCD EGDDDLVCDG 
DCTVPVYGDG VADNTAACDR DCSFPRCGDG VFNEFHLVQP DDGGAAYLEA CDDGNDENRD 
DCLDVCLAAR CGDGFVHSLG AGGETCDVDV DGDGVADNVA ACDSDCTAPA CGDGVHNAAA 
GEACDDGNED DGDACVSGCA AARCGDGFVF EGEELCDDGN ASNGDACPTG SGGSCEPARC 
GDGFIQAGVE QCDVGNGAVD TCAGGSECQP PNLPGACSCQ FT