Gene Hoch_3962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3962
Symbol
ID	8546358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	5463665
End bp	5464852
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	71%
IMG OID	646388634
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_003268354
Protein GI	262197145
COG category	[R] General function prediction only
COG ID	[COG4785] Lipoprotein NlpI, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.112319
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAGAA GCCGGACATC GACCTGGTCA TGGCTGGCCT GCGCGATGCT GGCGGCCGCG 
CTGGCCGCGG GCTGCGGCGC CAGCTCGCAG CAGCGCGTGG CCGAGGCCCG CGCCGACGGC 
GTCAAAGAGG CGCCCAAGCT GCCGCCGGTG GCCCCGGAGG CGCTCACGGC CTTCGACGAG 
GGCATGCGCT GGATGCGCGC TGCGCAGAAA CGCAAGCGCA CCAAGCCGCG CCGCGAGGCG 
CTCGACAAGG CGCGCACGGC GCTGCGTCGC GCGGTCGAGA TCGACGGCAC GGTGTGGGAG 
GCGTGGCACA ACCTGGGCGC GATTCAGTTC GCCGAGGGCG ACGACGAGGG CGCGACCGCC 
GCGTTCGGCA GCGCGCTCGC GGTCAATCCC GTGCACGTGG GCTCGCTGTT CGGCCGCGCC 
GAGGCCCACC GCCGCGCCGG GCGCACCGAC GAGGCCCGCA CGGACTACGA GGCCGCCGTG 
GCCCAGAGCG CCGAGGACAG CCCGCAGCGG CGCAACGCCA CCGCGCGGCT GGCCTCGCTG 
CTGCGCGAGG CCAAGCGCTA CGACGACGCG GTCGCCGTCA TCCGCGACAC CCTGCGCACC 
TCGGGCGCCA ACGCCCAAGT CTACGTCGAG CTGGGCATGA TCTACATGGC CCAGGGCCGC 
GACGACCTGG CCACCCTGGT GCTGGGCAAG GCGGCCGAGC TCGACCCCGA GCTGCCGTCC 
ATCTACAACG CCTACGCGCT GCTGGCGCTG TCGAGCGGCC GCGCCCAGGA GGCCTTCGAG 
CGCTTCGACT ACGCCACCTC GCTGGACCCG AGCTATCTCG ACGCGCGCTT CAACAAGGCC 
AGCGTGCTGC TCGACGCCGG CGACTACGCG CGCGCCAACG AGGAGCTCGC GGTGGTGGTC 
GCGCAGCGGC CCGAAGACAT GGATGCGCAG GTGGCGCTCG GTGTAGCGCT TCGCGGCATG 
GGCGAGTACG ATCAGGCCAA GTCGCAATGG GAGAAAGTCG TCCAGGAAGC ACCCACGCGG 
AGTCGGGTGC GCGGTGACGC GCTGTTCAAC CTGGCGGTAC TGCAGATGAG CTTTCTCGAG 
GACGAAAAGG GAGCTGTGGC CGCGTTCGAG CGCTTCCTCC AGGAAGCCCC GCGCAACCAC 
GGCAAGCGCA AGGCGGCCGA GGAGAAGAAA AAGGAGCTCG GCCTGTGA

Protein sequence

MSRSRTSTWS WLACAMLAAA LAAGCGASSQ QRVAEARADG VKEAPKLPPV APEALTAFDE 
GMRWMRAAQK RKRTKPRREA LDKARTALRR AVEIDGTVWE AWHNLGAIQF AEGDDEGATA 
AFGSALAVNP VHVGSLFGRA EAHRRAGRTD EARTDYEAAV AQSAEDSPQR RNATARLASL 
LREAKRYDDA VAVIRDTLRT SGANAQVYVE LGMIYMAQGR DDLATLVLGK AAELDPELPS 
IYNAYALLAL SSGRAQEAFE RFDYATSLDP SYLDARFNKA SVLLDAGDYA RANEELAVVV 
AQRPEDMDAQ VALGVALRGM GEYDQAKSQW EKVVQEAPTR SRVRGDALFN LAVLQMSFLE 
DEKGAVAAFE RFLQEAPRNH GKRKAAEEKK KELGL