Gene Hoch_1691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1691
Symbol
ID	8544073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	2301011
End bp	2302168
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	73%
IMG OID	646386399
Product	SMC domain protein
Protein accession	YP_003266134
Protein GI	262194925
COG category	[R] General function prediction only
COG ID	[COG4637] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.253328
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000000699352
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTGTCCG CGCTCGCCAT CTCGGGATAC CGCTCGCTGC GCGATGTCGT GCTGCCGCTC 
GATCGCCTCA ACGTCGTCAC CGGCCCCAAC GGCAGCGGCA AGTCCAGCTT GTACCGCTCC 
ATCCGCTTGC TGGCCGATGT CGCCCAGGGC CGTATCGTGG CCTCGCTGGC GGCCGAAGGC 
GGGCTCAGCT CGACGCTGTG GGCCGGGCCC GAGGCCTTCT CCCAGGGCAT GAAGCGCGGC 
GAGGTGGCGA TTCGCGGCAC CGCGCGCAAA GAGCGCGTGA GCCTCAAGCT CGGCTTCGCC 
GGCGAGGATT ACGGCTACGC CATCGATCTC GGCCTGCCGC CGCCGCTGCG CAGCGCCTTC 
GACCGCGACC CTGAGATCAA AGCCGAAGCG GTGTGGACCG GCGAAGTGCT CGCGCGCAAC 
AGCCTGTTTG CCTCGCGCCG CGGTCCCAGC GTCACCGTGC TCGACGACCA GGGCCAGCGC 
CGGCTGATAA GCGCGCAGAT GGCGCCCTTC GACAGCATGA TGACCCACGC CGCCGACCCG 
CGCGGGGCGC CCGAGCTGCT GGTGCTGCGC GAGCGCATGC GCGCCTGGCG CTTCTACGAC 
CACCTGCGCA GCGACGCCCG CGCGCCCGCG CGTCGCCCCC AGGTCGGCAC GCGCACGCCC 
GCGCTCGCGG CCGATGGCGG CGATCTCGCC GCCGCGCTGC AGACCATCGT CGAGATCGGC 
GATCACGAGG CGCTGCTCGA CGCGGTCAGC GACGCCTTCC CCGGCGCGGA CATCGAAATC 
GCCGTGAGCG CGGACGGCCT GTTCGAGCTC ACCATGCATC AGCGCGGGCT GCTGCGGGCG 
CTGCGCGCGG CCGAGCTGTC GGACGGCACG CTGCGCTACC TGTGCCTGGT GGCCGCGCTG 
CTGTCGCCGC GACCGCCCGG CCTGCTGGTG CTCAACGAGC CCGAGGCCAG CCTGCATCCG 
GATCTGCTGG CGCCGCTCGC GCGCCTCATC GCCGACGCGG CCACGCGCTC GCAGCTCATC 
GTGGTCACCC ACGCCGCGGC GCTGGTGAGC GCGCTGGCCG CGCACGAGCG CTGCGAGCTG 
CTGGCCCTCG ACAAGCAGCT CGGCGAGACC GTGCTCGAAG CGCACGAGCG CCCGCGCTGG 
ACCTGGCCCA AACGCTGA

Protein sequence

MLSALAISGY RSLRDVVLPL DRLNVVTGPN GSGKSSLYRS IRLLADVAQG RIVASLAAEG 
GLSSTLWAGP EAFSQGMKRG EVAIRGTARK ERVSLKLGFA GEDYGYAIDL GLPPPLRSAF 
DRDPEIKAEA VWTGEVLARN SLFASRRGPS VTVLDDQGQR RLISAQMAPF DSMMTHAADP 
RGAPELLVLR ERMRAWRFYD HLRSDARAPA RRPQVGTRTP ALAADGGDLA AALQTIVEIG 
DHEALLDAVS DAFPGADIEI AVSADGLFEL TMHQRGLLRA LRAAELSDGT LRYLCLVAAL 
LSPRPPGLLV LNEPEASLHP DLLAPLARLI ADAATRSQLI VVTHAAALVS ALAAHERCEL 
LALDKQLGET VLEAHERPRW TWPKR