Gene Hoch_5019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5019
Symbol
ID	8547429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	6923699
End bp	6924901
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	68%
IMG OID	646389695
Product	VWA containing CoxE family protein
Protein accession	YP_003269401
Protein GI	262198192
COG category	[S] Function unknown
COG ID	[COG3825] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.232102
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0213025
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCGTCG ATTTCCTCTA CGAGCTGCGC AGCCGCGACG TAAAGGTCTC GTCGCACGAG 
TGGATGGCGC TGATGGACGC GCTGGCCCTG GGCCTGCACG ACTCCTCGCT CGACGGCTTC 
TACCGGGTGG CGCGCTCCAT CTGCGTCAAG GACGTGGCCC AGTACGACGC CTTTGATGAG 
GCCTTTCTCG CCTACTTCAA AGACGTGCAC GTCGACGCCC TGGCGCTGAG CGAGCAGCTC 
TTGCAGTGGC TGCAGGATCC GGCCGCGCGG CGCCGGCTCA GCCCCGAGGA GCTGGCCATG 
CTCGAGAGCA TGGACCTCGA GCGGCTGCGC GCGCTGTTCG AGCAGCGCCT GCGCGAGCAG 
AAGGAGCGCC ACGACCGCGG CAACCGCTGG ATCGGCACCG GCGGCACCTC GCCCTTTGGC 
AACGGCGGCA CCTTCCCCGG CGGCCTGCGC GTCGGCGGCA TGGGCGGCGG CCGCTCGGCC 
ATGCAGGTGG CCGGCGAGCG ACGCTTTCGC AACTACCGCA AGGATCTGGT GCTCGACGTG 
CGGCAGATCG ACCTGGCGCT GCGCGACCTG CGCCAGCTCG GTCGCGAGGG TGCCGAGGAG 
GAGCTCGACC TCGACGAGAC CGTGGACAAG ACCTGCAGCA ACGCCGGCGA GCTCGAGCTG 
GTGTTCCGGC CGCCGCGGCG CAACCGGGTC AAGCTGGTGC TGATGATGGA CGTGGGCGGC 
TCGATGGACC CCTACGCCGA GCTGGTCGGT CGACTGTTCA CGGCGGCCTC GCGCGCCGGT 
CGCTTCGCCA AGTTCCGCAG CTTTTATTTC CACAACTGCG TGTACGAAAA AGTCTACGAG 
GACGGCCACT TTCGCGACGG CATACCGGTG GAAGAGCTGA TTGCGAATAG CGATCGCGAC 
GAGAAGCTGG TGTTTGTCGG CGACGCCTGG ATGCATCCGG CGGAGCTCTT GCAGCCGGGC 
GGATCGATCT TCTACGACCA CCAGAACCGC CGCGCCGGCA TCGACTGGCT GCGGCGCCTG 
AGCGAGCATT TCCGCCGCAG CGTGTGGCTC AACCCCGAGG CCAAGCGCTT CTGGGCGCAG 
AGCACCATCG AGATGATCGC GCGCGTGGTG CCGATGTATC CGCTGAGCGT GAGCGGCATC 
GGCGACGCCG TGCGCTACCT GGTGCGCGGC GGCCGCGCTC CCGACCCGGT GGACGAAGAC 
TGA

Protein sequence

MLVDFLYELR SRDVKVSSHE WMALMDALAL GLHDSSLDGF YRVARSICVK DVAQYDAFDE 
AFLAYFKDVH VDALALSEQL LQWLQDPAAR RRLSPEELAM LESMDLERLR ALFEQRLREQ 
KERHDRGNRW IGTGGTSPFG NGGTFPGGLR VGGMGGGRSA MQVAGERRFR NYRKDLVLDV 
RQIDLALRDL RQLGREGAEE ELDLDETVDK TCSNAGELEL VFRPPRRNRV KLVLMMDVGG 
SMDPYAELVG RLFTAASRAG RFAKFRSFYF HNCVYEKVYE DGHFRDGIPV EELIANSDRD 
EKLVFVGDAW MHPAELLQPG GSIFYDHQNR RAGIDWLRRL SEHFRRSVWL NPEAKRFWAQ 
STIEMIARVV PMYPLSVSGI GDAVRYLVRG GRAPDPVDED