Gene Hoch_3767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3767
Symbol
ID	8546160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5178765
End bp	5179907
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	67%
IMG OID	646388437
Product	signal peptidase I
Protein accession	YP_003268160
Protein GI	262196951
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0681] Signal peptidase I
TIGRFAM ID	[TIGR02227] signal peptidase I, bacterial type

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0219598
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.176079
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACTT CTGCAGCAGA CGCGCGCATC GAGCGCAAGC TTCACACCGA GGTCAAGAAG 
CTGGTGCGCG AGACCCGCGC CAGTCTCGGC CGGCACGGCT CGCGACTCAG CAACCGGGTG 
CGCGAGGATA TCGAGGGCCG GGTCGAGCGA CTCGAGACCG CGATGCGCGA GAAGGACGGC 
ACCACCATGC GCGTGGAGCT GCCGGTTCTC GACGCCATGG TCGACGAACA GCTCGCGTTT 
GCGCGCAAGT CGGCATTTCG TGAGTACGCC GAGTCGATCG GCATCGCCGT GATCATCGCC 
GTGCTGCTGC GCACCTTCGT GATCGAGGCG TTTAAGATCC CGTCGGGCTC GATGATCCCG 
ACCATGGAGA TCGGCGATCA CATCTTCGTC AACAAGTTCC TCTACGGCAT CCGCATCCCG 
GTGCTGGGCG TGAAGTTCTT CCAGTTCCGC AAGCCCGAGC GCGGCGAGGT CATCGTCTTC 
GAGAAGCCGC GCGACCGCGA GCGCCGCGAC TTCATCAAGC GTATCGTGGC CGTGGCCGGC 
GACACCCTGG AGGTGCGCTG CGGCATGCTG TACGTCAACG GTGAGCGCGT GAGCCGCGAG 
CTGGTGGCGG CCAGCGATTT CCACTGGGAT GACCCGCCCG AGCCCGGCAC CGGCGACACC 
TGGACGCGGG TGGAGAGCAG CCGCTACCGC GAGACCCTGG GCGAGACCCG CTACGACACG 
CTCTACGATC CCGACCGGCC CGAGTACGAG CACCTGGTCG ACGCCGGCGG GGCCGCGGGC 
TGGGGCGCGT CCTCGAGCCT GACCAGCCGC GACTTCCCCA TGCAGAGCAG CGCGATCTTC 
CCCGACTTCA ACCGCATCCC GCGCTGCGCC GACCACAGCG AGGAGAGCAG CTCGATCGGC 
TGCTACGCGC CCTCGCCGCA GACGCAGAAG GGCGACGCCG GGGCGTGCGC GCTGCAGCGG 
CACTACGTGG TGCCCGAGGG CCACGTCTTC GGCATGGGCG ACAACCGCGA GAACTCCAGC 
GACTCGCGGC AGTGGGGTCC GGTGCCGCTC GACAATATCA AAGGCAAAGC GCTGTTCATC 
TGGTGGTCGT CGAACGACAA GGTAGGTGTG CAGTGGGATC GTATCGGTAA GGTCGTAGAA 
TGA

Protein sequence

MATSAADARI ERKLHTEVKK LVRETRASLG RHGSRLSNRV REDIEGRVER LETAMREKDG 
TTMRVELPVL DAMVDEQLAF ARKSAFREYA ESIGIAVIIA VLLRTFVIEA FKIPSGSMIP 
TMEIGDHIFV NKFLYGIRIP VLGVKFFQFR KPERGEVIVF EKPRDRERRD FIKRIVAVAG 
DTLEVRCGML YVNGERVSRE LVAASDFHWD DPPEPGTGDT WTRVESSRYR ETLGETRYDT 
LYDPDRPEYE HLVDAGGAAG WGASSSLTSR DFPMQSSAIF PDFNRIPRCA DHSEESSSIG 
CYAPSPQTQK GDAGACALQR HYVVPEGHVF GMGDNRENSS DSRQWGPVPL DNIKGKALFI 
WWSSNDKVGV QWDRIGKVVE