Gene Hoch_1413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1413
Symbol
ID	8543795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	1898893
End bp	1900311
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	62%
IMG OID	646386125
Product	transposase IS4 family protein
Protein accession	YP_003265860
Protein GI	262194651
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAATCGA GCAGAGCCAA CATCCACCGG CGATACCATA AGGTGCCGGC GCTACGATTC 
GCGGAGGATG GGCGCCTGAC CGCGTACGCA GGATTAGTGC TGGTCCAAGT GCTGATAGCA 
GCACTTGGCC TGAAAAAGCG GCTACGGCGC TGCTTCAGCC ATCTCGGTAA AGACAGCATC 
TATGGGATGG GTAAGATGGT GTTGCTGCTG CTCGTGGCCA TCCTGCTAGG ATGCCGGCGT 
CTGAGAGACC TCGACTACTG TCGTGAAGAT CCGCTCCTGA AACGAGTCGT GGGCGTGAAG 
CGGTTACCGG ACGTAGCGAC GATATCGCGC GCCCTGACAA AGATGGATGA GCGAGGTGTG 
GAGGGAATGC GAAGCGAGGT GCGGGGGCTG GTGCTAGAGC GCTTGGAAGG AGAAGCGCAG 
AGCCGGGTGA CGGTAGACTT CGATGGCTCG GTGCAGACGA CGCGAGGTCA CGCAGAGGGA 
ACAGCGGTGG GGTACAACCC GCTCAAGAAA GGCGCTCGGA GCTACTATCC GCTGTTCTGC 
ACAGTGGCGC AGACAGAGCA GTTTTTCGAC GTGCTGTTCC GCTCAGGCAA CGTGCACGAC 
TCCAACGGGG CCAGTGGCTT CATGAGCGCA TGCCTCAGCG AGTTGCACGA GCGGCTGCCT 
CGCGCGCAGC TCGAGACCCG GGTCGATAGC GCGTTTTTCA ACGAGCGGGT GCTCGCCACG 
CTGCACGAGC GTGGAGTGGA GTTTAGCTGT TCGGTGCCGT TCGAGCGGTT TCCTGCGCTC 
AAAGCGTTGG TGGAGGAGCA GCGGGAATGG CGTGCTCTGG ACGAGCGATA CTCCTACGCC 
GAAGTCGCCT GGAAGCCGCA ATGTTGGGGC GTGAGGTATC GCATCCTGCT CGTGCGGCAG 
CGCAAGAAGC CGCGTAGCCC TCGACCCATC CAGCTCGACC TGTTCGTTCC GTTCGACGAG 
GTGTACGAGT ATACAGTGGT GGCGACCAAC AAGAAGGTCT CGCCTCGGGC GGTGCTCGGT 
TTCCATCACG GGCGTGGCTC GCAGGAGAAG CTCTTTGGCG AGGCCAAGCA GCATGCCGCT 
CTCGACGTGA TTCTGGGACG GCGTCAGAAG GCCAACCAGC TCTTCTCCCT CTGCGGCATG 
CTCGCTCACA ATTTGTCCCG CGAGATGCAG ATGATGCGGT GGCCCAAAGA GCGCCCTACG 
CAGCGCAAGC GCCCTGCCCA CTGGCGCTTC CACAGCCTTG GCACGCTACG GCAGCGATTG 
TTCCATCGCG CGGGTCGCCT GCTTCGTCCG CAAGGCCATC TCACCCTCGA ACTCAACGCG 
AATTCCGACG TGCGGTCCGA ATTTGAAGGC TACCTCGACG CCATGCTCCA CGGCGCTCGT 
TTCGGTGCCG CCTCCGACAG TTCTGCCGCC CAAGCCTAG

Protein sequence

MKSSRANIHR RYHKVPALRF AEDGRLTAYA GLVLVQVLIA ALGLKKRLRR CFSHLGKDSI 
YGMGKMVLLL LVAILLGCRR LRDLDYCRED PLLKRVVGVK RLPDVATISR ALTKMDERGV 
EGMRSEVRGL VLERLEGEAQ SRVTVDFDGS VQTTRGHAEG TAVGYNPLKK GARSYYPLFC 
TVAQTEQFFD VLFRSGNVHD SNGASGFMSA CLSELHERLP RAQLETRVDS AFFNERVLAT 
LHERGVEFSC SVPFERFPAL KALVEEQREW RALDERYSYA EVAWKPQCWG VRYRILLVRQ 
RKKPRSPRPI QLDLFVPFDE VYEYTVVATN KKVSPRAVLG FHHGRGSQEK LFGEAKQHAA 
LDVILGRRQK ANQLFSLCGM LAHNLSREMQ MMRWPKERPT QRKRPAHWRF HSLGTLRQRL 
FHRAGRLLRP QGHLTLELNA NSDVRSEFEG YLDAMLHGAR FGAASDSSAA QA