Gene Hoch_3433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3433
Symbol
ID	8545821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4743766
End bp	4745115
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	65%
IMG OID	646388100
Product	transposase IS4 family protein
Protein accession	YP_003267828
Protein GI	262196619
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.168872
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0300834
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATCTGA GCACCGCCCT GCAATGTGTT GCGTCGTATC CTCCCCCGGA GGAGTTCTCT 
CGTCTTGCCC GCGATGTCGC GCCGGAATGG ATCGAGCAAG CGCTCGAGGC GACCGGGACG 
GCGACCTTGC GCCGGCGCCG ATTACCGATG GAGCAGTTGG TCTGGCTGGT TATCGGCATG 
GCCCTGTTCC GCGACCGTCC GATCACCGAG GTGGTCACCA GTCTGGACCT GGCGCTGCCG 
AGCCCTGGCC ATCCTGAGGT AGCGCCGAGC GCGGTGGCGC AGGCCCGCGA CCGGCTGGGC 
GAATCGCCTA TGGCGTGGCT GTTCGCCCAC AGCGCCGACC GATGGGCGCA TCAAAGCGCG 
GCCGACGATA GATGGCGGGG GTTGGCGCTC TACGGGGTAG ATGGCACGAC GCTGCGGGTG 
CCCGACAGCG AGGAGAATCG GGACCATTTC GGCCTGGCCA ACGGCGGCGC TCGCGGCAGC 
AGCGGCTACC CTGTGGTTCG CCTGGCTGCG TTGATGGCGC TGCGCTCGCA TCTGCTGGCA 
GCGGTGTCGT TTGGCCCATA TCAGGGCCAC GGCGAGTACT GGTACGCGGC GGATCTATGG 
CCATGTTTGC CCGATAACTC GCTCGTCATC GTCGATCGAC ACTATTGGGC CGCCAACGTG 
CTAATTCCGC TCCAGCAGGA CGGGTTGAAT CGGCACTGGC TCATCCGCGG GCGAAAAGGT 
CTCAACTATC GTGTCGTCGA GCAGCTCGGG CCGAGCGACG AGTTGGCCGA GGTGAAGGTC 
TCACCGCAGG CTCGGTCCAA GAACCCGGAG CTACCCCGGA CGTGGACGGT CCGAATCATC 
CACTACCAGC GCAAAGGATT TCGACCACAG CGACTGTTTA CCTCACTGCT CGACCCGGTC 
GCCTATCCGG CCGACGAGTT GGTTGCGCTC TACCACGAGC GTTGGGAGAT CGAACTCGGA 
TACGACGAGG TGAAGTCCAA GATGCTCGCC AATGTCCCGT TGCGCAGCAA ATCCGTGGAC 
CGAGCCCGCC AAGAGATCTG GGGGCTGCTC ATCGCCTACA ACCTCATTCG CCTCGAGATG 
GCGCGAGTCG CCCACGAGGC TGGTGTGCCG CCCACGCGTA TCAGCTTCGT CACGGTCTTT 
CGCCTCATCT GCGCCGAGTG GCTCTGGTGT AGTCACTCCA AGCCCGGCGC TATCCCCCGA 
CATCTTCGGA ACCTGCGACG TAATATCCGT CGCTTCATCC TGCCGCCCCG CCGCACCGAA 
CGCAGCTACC CGCGAGCCGT CAAGGTCAAG ATGAGCAGCT ACCCGCGGAA GCGACGTCCT 
GCCCAGGCTC GGCCCGCGTC CGCCAAGTGA

Protein sequence

MHLSTALQCV ASYPPPEEFS RLARDVAPEW IEQALEATGT ATLRRRRLPM EQLVWLVIGM 
ALFRDRPITE VVTSLDLALP SPGHPEVAPS AVAQARDRLG ESPMAWLFAH SADRWAHQSA 
ADDRWRGLAL YGVDGTTLRV PDSEENRDHF GLANGGARGS SGYPVVRLAA LMALRSHLLA 
AVSFGPYQGH GEYWYAADLW PCLPDNSLVI VDRHYWAANV LIPLQQDGLN RHWLIRGRKG 
LNYRVVEQLG PSDELAEVKV SPQARSKNPE LPRTWTVRII HYQRKGFRPQ RLFTSLLDPV 
AYPADELVAL YHERWEIELG YDEVKSKMLA NVPLRSKSVD RARQEIWGLL IAYNLIRLEM 
ARVAHEAGVP PTRISFVTVF RLICAEWLWC SHSKPGAIPR HLRNLRRNIR RFILPPRRTE 
RSYPRAVKVK MSSYPRKRRP AQARPASAK