Gene Hoch_5391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5391
Symbol
ID	8547803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	7410259
End bp	7411512
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	68%
IMG OID	646390064
Product	Extracellular ligand-binding receptor
Protein accession	YP_003269768
Protein GI	262198559
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.59544
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.2602
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGAC GCGCACAACG ACTCATTCCC TGGGCGGCCG CGCTGCTGCT CGCCGCCTCC 
GTCGGCGCCT GCAAGAAGGA CGAGGGCGGC GCCGCGGGCG AGAATCCCGA GGGCAGCGCC 
ACCGCGACCG ATTCGGGCGA GCCCATCGTG ATCGCCGTGG CCGGGCCGAT GACCGGCCAG 
TACGCCTCGT TCGGCCAGCA GATGGCCGCG GGCGCCAAGC AGGCGGTCGC CGATCTCAAC 
GCCAAAGGCG GCGTCCTGGG CCGACAGCTC CAGCTAGAGG TCGGCGATGA CGCCTGCGAT 
CCCAAGCAGG CGGTGGCCGT GGCCAACCAG ATGGTGCAGC AGGGCGCGGT GTTCGTGGCC 
GGCCACTGGT GCTCGGGGTC CTCGATTCCG GCCAACCAGG TGTACGACGA AGAGGGCATC 
GTATCGATCT CGCCCGGCTC GACCAGCCCC AAGCTCACCG AAGAGGGCGG CGAGATGGTG 
TTCCGCGTGT GCGGCCGCGA CGACCAGCAG GGCGAGGTGG CCGCCAAGTT TCTGATGGAA 
CAGTTCCCGG GCAAGAACAT CGCGGTGCTT CACGACAAGA CCGCGTACGG CAAGGGTCTG 
GCCGATGAGA CCCGCAAGAA CCTGCAGGCC GGCGGCCTCG AGCCGACGCT GTACGAGGCC 
TACACCGCGG GCGAGAAGGA CTACACCGCG CTGGTCTCCA AGCTCAAGCA GAACGAGATC 
GACGTGGTCT ACATCGGCGG CTACCACACC GAGGCCGGCC TGATCCTGCG CCAGATGCGC 
GAGCAGGGCA TGGAGTCGGT GCTGATGTCG GGCGACGCCC TGGTCACGCA GGAGTACTGG 
TCGATCACGG GCGACGCCGG CGCCGGTACG CTGATGACCT TCAGCCCGGA TCCGCGCAAG 
AACGAGAACG CGGCCGCCGT GGTCGAGGTG TTCCGCGAGC AGAAGATCGA GCCCGAGGGC 
TACGTGCTCT ACACCTACGG CGCGATCCAG GCCTGGGCCG CGGCTGCGGA GGCCGCTGGT 
AAGGTGGATG CCGACGCGGT GGTCGAAAAA CTGCACGCGA TGGAGTTCGA GACTGTGCTC 
GGCTCGATCG GTTTCGACGA CAAGGGCGAC GTCACCGCCC CCGGCTACGT GGTCTACGAG 
TGGAAGGACG GCGCCTACGC GTACTACGGC GAAGAGGGCG GGGCGCAGGC CGAGGGCGGC 
GAGGGCGGCG AGGGCGAGAA CGAGAACGAG AACGGGGAGC CCCCGAGCGA GTAG

Protein sequence

MIRRAQRLIP WAAALLLAAS VGACKKDEGG AAGENPEGSA TATDSGEPIV IAVAGPMTGQ 
YASFGQQMAA GAKQAVADLN AKGGVLGRQL QLEVGDDACD PKQAVAVANQ MVQQGAVFVA 
GHWCSGSSIP ANQVYDEEGI VSISPGSTSP KLTEEGGEMV FRVCGRDDQQ GEVAAKFLME 
QFPGKNIAVL HDKTAYGKGL ADETRKNLQA GGLEPTLYEA YTAGEKDYTA LVSKLKQNEI 
DVVYIGGYHT EAGLILRQMR EQGMESVLMS GDALVTQEYW SITGDAGAGT LMTFSPDPRK 
NENAAAVVEV FREQKIEPEG YVLYTYGAIQ AWAAAAEAAG KVDADAVVEK LHAMEFETVL 
GSIGFDDKGD VTAPGYVVYE WKDGAYAYYG EEGGAQAEGG EGGEGENENE NGEPPSE