Gene Hoch_5464 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5464
Symbol
ID	8547877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	7502160
End bp	7503098
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	63%
IMG OID	646390137
Product	Substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_003269840
Protein GI	262198631
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.102731
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGTAC GTCATCTCGA GAAATTGGGA ATCGCCGCGC TCGTGGTCGG ATGCGGGCTC 
AGCGGTTGCA GCAAAGAGGC CGAGAAGCCG GCGACCGAGA CCACCGAAGG CACCGAGACC 
GCCGAGACCG CTGAGACCGA GGAAGCTGGC GAGGAGAAAG TCGCCAACCT CGTGTACGTG 
AACTGGGCCG AGGGCATCGC CTACACCCAC CTGGCCAAGG TCGTGCTCGA GGACAAGATG 
GGCTACGAGG TCAAGCTCAC CGCCGCCGAC GTCGGCCCGG CCTACACCTC GGTGGCCCAG 
GGCGACCAGG ACGCCTTCAT GGAGACCTGG CTGCCGACCC TGCACAAGGA CTACATCGAG 
AAGTTCGAGG GCAAGCTGGT CGATCTCGGC CACGTGTACG AAGGCACGCA GAGCGGCCTG 
GTCGTGCCCG CCTACGTGCC GATCACCAAG ATATCCGAGC TCAAGGATCA CAAGGACAAA 
TTCGACGGCA AGATCACGGG TATCGACGCC GGCGCCGGCA TCATGAATAC CACCGAGGAG 
GTCATCGCTT CCTACGACCT GGGCTTCACC CTGCTGCCCT CGAGCGGCCC GGCCATGACC 
TCGGCGCTCA AGAACGCCAT CGACAAAGAG GAGTGGATCG TGGTCACCGG CTGGCGTCCG 
CACTGGAAGT TCGGCCGCTG GGACCTCAAG TTCCTCGAGC AGGATGAGGA CAAGATGGTG 
TGGAAGGAGG GCAACATCCA CATCACCGGC CGCGCCGGCA TCAAGGAAGA CAAGCCCACC 
CTGGCCGCGT TCCTGAGCAG CATGATGCTC ACCGACGAGC AGCTCGGCGA CCTGATGATC 
AAGGTGAACG AGAGCGACGG CAAGGACGTC GAGGACGTCG CCCGCCAGTG GATGGCCGAC 
AACGAGGCTG TCATCACGGC GTGGGTGCCG GCCTCCTGA

Protein sequence

MFVRHLEKLG IAALVVGCGL SGCSKEAEKP ATETTEGTET AETAETEEAG EEKVANLVYV 
NWAEGIAYTH LAKVVLEDKM GYEVKLTAAD VGPAYTSVAQ GDQDAFMETW LPTLHKDYIE 
KFEGKLVDLG HVYEGTQSGL VVPAYVPITK ISELKDHKDK FDGKITGIDA GAGIMNTTEE 
VIASYDLGFT LLPSSGPAMT SALKNAIDKE EWIVVTGWRP HWKFGRWDLK FLEQDEDKMV 
WKEGNIHITG RAGIKEDKPT LAAFLSSMML TDEQLGDLMI KVNESDGKDV EDVARQWMAD 
NEAVITAWVP AS