Gene Hoch_3185 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3185
Symbol
ID	8545573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4388666
End bp	4389826
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	69%
IMG OID	646387852
Product	extracellular solute-binding protein family 3
Protein accession	YP_003267580
Protein GI	262196371
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0319469
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.327167
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTTCC CCGTCTGCCT GCTCGTGTCC CTGCTGTGCG CGTTCCCGGT CGCCGCCTCG 
GCGCAGACCC AGACCCCGCC AGCGACACCG GCTGAGCCAG CGGCTGAGAC GGGCGACACG 
CTCGCGCAGG CGGCCGAGGA TGCGGTCGAA CGCATCGAGC GCGATGAGCT GCGCATCGGT 
ATCAGCACGT TCCCGCCCTT CGTGCTCACC GGAGGTAATC CCCACAGCGG CTTCTCGATC 
GAGCTGTGGC GGCTGGTCGC CGAGAGCCTG GACGTCGATT ACACCTTCGT CGCCAGCACC 
GGCGTGGCCG ACAAACTCGC GCGCCTGCGC GGCGACCAGC TCGACGTCGC CATCGGCGGC 
ATCACGGTAA CCACCGAGCG CGAGCGGCTG GTCGATTTCA CCCACCCGGT CACCGACAGC 
GGTCTCGGCA TCCTGGTCCG CGAAGGCGAA GGCGGCGGCG CCGGCTTTTT CCAGCGCATC 
ACCTTCAACG ACAGCAAATG GGGCCTGGTC ATCGGATTTT TGGCCCTGGT CATCGTCGCC 
GGCAACCTCA TCTGGTGGGC CGAGCGGGGC CGCGAATCGT TCAGCGATAA GTACTTCCCC 
GGCGTCTTCG AGGGCATGTA CTGGGCCATC GTCACCGCCA GCACCGTGGG CTACGGCGAC 
AAGACGCCGA CGAGCTGGCG CGGCCGCGCG ATCGCCGGGC TCACCATCGT CATCACGCTG 
CCGCTCTTCG CCCTGTTCAC GGCCGAGCTG GCCTCGACCA TCACGGTCGC CGAGATCCAA 
TCGCGCATCG ACGGACCCGA GGATCTGCGC GACAAGCGCG TCGGCGTGGT CCGCGGCACC 
GTGGCCGCGG ATTGGGCCGC GGGCTTCGGC CTCGAACTCG TCCAGTGGGA CGGAATCGGC 
GAGGTCTACG ACGCGCTCGA TCGCGAGGTC GTGGACGCCG TCATCCACGA CGCGCCCAGC 
CTGCAGTACT ACGCGCAGAA CCAGGGCAAG GACGACGTGC AGGTGGTCGG CGGTCTGTTC 
CAGGCGCAGT CCATCGCCTT CGCGCTGAAC GAAGGCTCGC CGCTGCGCGA GCCGCTCAAC 
CGCGCCCTGC TCTCACTGGT CGAGTCGGGC GAACTCGAGC GGCTGCGCGT GCGCTGGTTC 
GGCACCGGTG CGCGCAAGTA A

Protein sequence

MRFPVCLLVS LLCAFPVAAS AQTQTPPATP AEPAAETGDT LAQAAEDAVE RIERDELRIG 
ISTFPPFVLT GGNPHSGFSI ELWRLVAESL DVDYTFVAST GVADKLARLR GDQLDVAIGG 
ITVTTERERL VDFTHPVTDS GLGILVREGE GGGAGFFQRI TFNDSKWGLV IGFLALVIVA 
GNLIWWAERG RESFSDKYFP GVFEGMYWAI VTASTVGYGD KTPTSWRGRA IAGLTIVITL 
PLFALFTAEL ASTITVAEIQ SRIDGPEDLR DKRVGVVRGT VAADWAAGFG LELVQWDGIG 
EVYDALDREV VDAVIHDAPS LQYYAQNQGK DDVQVVGGLF QAQSIAFALN EGSPLREPLN 
RALLSLVESG ELERLRVRWF GTGARK