Gene Hoch_1036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1036
Symbol
ID	8543418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	1322383
End bp	1323966
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	65%
IMG OID	646385789
Product	SEFIR domain protein
Protein accession	YP_003265524
Protein GI	262194315
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCCGA CCATGCCCCA GTCCGAGCCG GAGAAGGCAT CAGCGTCGGC CCCTCGAGTT 
TTCCTCAGCT ACAGTCACGA CTCCCCCGAA CATCGTGATC GCGTCCTGGA CTTGGCTCAG 
CGCCTACGGC GAGAGGGCAT AGACGCGTGG CTGGATCGCT TCACGCCGCA TCCGCCCGAG 
GGCTGGCCGC GCTGGATGCA GCGCCAACTC GAGCAGGCCG ACCACGTGCT CGTGGTGTGC 
ACCGAAACCT TTTGTCTCCG GTTCAACGGT CACGAGGAAC CGGACCGAGG CCTCGGTGCG 
ACGTGGGAAG GGTTTTTGGC CACCCAGGTG CTCTACGAGA GCGGAACGCG CAACGACAAA 
CTGATTCCGG TGCTCATGGA AGGCGCCCGG CAAAGCGATA TCCCTCTCGC GCTACGAGCC 
TACACGCATT ACCGAGTGCC TGGCGGCTAT GATCAGTTAT ATCGGCAGAT AACGCAGCAA 
CCCGAGGTCG TGCCCGCAAA CTTGGGTGAG GTGCGCGAGA TGCCGCAGCA GCAGACGCGA 
GCAGCAGACG CGATACATGC TCGTGGCACG GAGCCGGGCG CGGTGCCTGA GATGTCGCCG 
CTGTCTGAAG GCGTAGCGGA GACCCCGGGC GGACCAATCA GCCCGTTTTT GCCGGGCGTT 
ATCGCCAAGC GAGCCGAAGA TTTTTTCGGA CGGCAACGCG CGCTGGACGA GATCACTCAT 
TCGATTCACC ATCGCCAGCC CATTCAGATC CTAGGAGAGG CGCGCATGGG CAAGTCGTCG 
CTGCTCGCCC ACGTGGCACG TACCCTCGTG CCCGGCGACA TGCAGGTGGC CGAAGTGCAC 
GCCCGCGGCC GCTCGGGTTG GTCGCCACGC GAATTGATCT TGGCCATGGC CGACGCGCTC 
GGTCAACGAG CGGTCGTCGA CAGCGTACTG CGGGCTGCGC CGGCGACGGT CGATGAGGCA 
CCGGCGGCCG TAAACGCCTT GCAGTTCCTC CTTCCGTGCG CGCTGCTGCT GGACGACGCT 
GACGCCATCG CCGACGCGGG GCACCACTTC GACCGCGCGT TTCTGGACGA ATGCCGCGCT 
TTGACCCAGT CTCGCCGCCT GCTGTGGATT TCGGCCTCGC GCCGAGATTT GCAGAGCTGC 
TTCCGCGAGA CCGGCCTCAG CTCCGAGCTT CTCAACAACT CGCGACGCGT TGTTATCGGT 
CAGCTGGACA AAAAAGAGAC TGAACAGCTG CTGGGCGTGC TAGGCGCCTC CATGGATGAA 
CGTTGCTACC GCCAGGCCGG CGGCTGGCCT GATGGTCTGC AATGGCTGGG GGACCGACTC 
TGGCGCGACG GCGAGCGAGC GTCCACAGAC GATGATTTCG CTAACGCCAT GGAGCAAACC 
TTCCGAAGTT GGTGGAAGTT GCGCACGCAG GCCGAGCACG CGCTTCTGCG GCGCCTGGTT 
TTGCCCACCC CGATTACCGG ACTGTCGGAT AGCGAACGGA GGCGGGCGCG CAAGCTCGTG 
TCTCGCGGTC TGCTCTGCGA GCGAGATGGC GCGTTCGCGC TGCTCGGCGC GGCCTGGGCG 
AACTGGGTGC GCGATGTCGA GTGA

Protein sequence

MIPTMPQSEP EKASASAPRV FLSYSHDSPE HRDRVLDLAQ RLRREGIDAW LDRFTPHPPE 
GWPRWMQRQL EQADHVLVVC TETFCLRFNG HEEPDRGLGA TWEGFLATQV LYESGTRNDK 
LIPVLMEGAR QSDIPLALRA YTHYRVPGGY DQLYRQITQQ PEVVPANLGE VREMPQQQTR 
AADAIHARGT EPGAVPEMSP LSEGVAETPG GPISPFLPGV IAKRAEDFFG RQRALDEITH 
SIHHRQPIQI LGEARMGKSS LLAHVARTLV PGDMQVAEVH ARGRSGWSPR ELILAMADAL 
GQRAVVDSVL RAAPATVDEA PAAVNALQFL LPCALLLDDA DAIADAGHHF DRAFLDECRA 
LTQSRRLLWI SASRRDLQSC FRETGLSSEL LNNSRRVVIG QLDKKETEQL LGVLGASMDE 
RCYRQAGGWP DGLQWLGDRL WRDGERASTD DDFANAMEQT FRSWWKLRTQ AEHALLRRLV 
LPTPITGLSD SERRRARKLV SRGLLCERDG AFALLGAAWA NWVRDVE