Gene Hoch_2271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2271
Symbol
ID	8544657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	3161432
End bp	3162589
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	72%
IMG OID	646386976
Product	hypothetical protein
Protein accession	YP_003266707
Protein GI	262195498
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0830218
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGTTC CCAAGACCCT CTCGCGCTTG TCACAGGCCC CGCAGGATCC CGAGGAATTG 
CGACGCGTTG CTCGCACCCT GGCCAGTACC TTGCACAGTA AGCGCGGCAC GCAGACGAAC 
GGCGCGCGCG CGTACCTGGC GCAGCACGCC ACCAAACACG GCGATTTCGC GGCCGGCTAC 
AGCGCCAGCC TGTGTGATAT CGCGGTCGAA CACAGTCGCG CCGCGGCCGA AGACGACGAC 
ATCGAATGCG CGCGCCGGCT GCTCGTCGAC CGGCAGATGC GCGAGCTGCT GGCGCGTCTG 
GCCGTCGAGC CAGCGCGGCC GAGGGCGCTG GCCGAGGTCG TGGAAGAGAG CACGGCCCAG 
GTCGCCGAGC GCCTCGATCA TCTCGCTGCC GTGGGGCTGG TGCAGGCCTA CGCCGCGGGC 
ACGGACGAGC GCCACATGGC CGTGTATCGG GCCACGCGCA CGGGCCGACG CTTGCTCGAC 
GAGCTCGGCC CGAACCTGAG CACGCCCATC GAGCAGGGCA TCCGCCTGGC CGTCTCGCTT 
TTCGACTACC TCGCGCAGCA CCAGCTCAGC CCGGCCTCGG CGCTGCACGA GATCGCCGAA 
GAGCTGCTCC ACGATCCCGC CGCCGCGGTC GCCGCCGTCC GCGCCTGGGC CGAGGCCGCG 
AGCGAGCGCG GCCTGGTCGA TGAATTCGGC AGCGCGCCCC TGGCCGAGGG CACCGGCGCC 
AAGCGCGCGC CCGGCTACCG CGCCAGCACC AGCGCGGCCG GCGAGCTGCG CTCCGCGCAT 
CTGTGGCGCG AGGCCCCGGC CCTGCTCGAG CAGCTCGGCA GCGAACGCGC CGCGCCCGTG 
TACGTGCGCA CCGATCCCGC CGGCTGGAGC GCCTGGGCCT TCGCCCTCAA CAGCCGCGAC 
CACAGCGGCC GCTCGCGCAC CATCGTCGAC GGCGACATCC TCGCGCAGTC CGTAAGCCCG 
CCCGAGCACG GCTTCGACCT GGTCTACGAC CGCCGCGACA CCCTCGACAG CGACAGCCGC 
GAGCCGACCA TGCGCGCCTT TCTCGAGCGC GCCGAGCAGC GCTTTCTCAT CGCGGCCGAT 
GACGAGGACG TCCCCGAGGG CTTCATCCGC CTGGCGCCGC CGCCGCCCGA CAGCGACAGC 
GACAACGCGC CGAGTTGA

Protein sequence

MNVPKTLSRL SQAPQDPEEL RRVARTLAST LHSKRGTQTN GARAYLAQHA TKHGDFAAGY 
SASLCDIAVE HSRAAAEDDD IECARRLLVD RQMRELLARL AVEPARPRAL AEVVEESTAQ 
VAERLDHLAA VGLVQAYAAG TDERHMAVYR ATRTGRRLLD ELGPNLSTPI EQGIRLAVSL 
FDYLAQHQLS PASALHEIAE ELLHDPAAAV AAVRAWAEAA SERGLVDEFG SAPLAEGTGA 
KRAPGYRAST SAAGELRSAH LWREAPALLE QLGSERAAPV YVRTDPAGWS AWAFALNSRD 
HSGRSRTIVD GDILAQSVSP PEHGFDLVYD RRDTLDSDSR EPTMRAFLER AEQRFLIAAD 
DEDVPEGFIR LAPPPPDSDS DNAPS