Gene Hoch_5004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5004
Symbol
ID	8547414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	6900912
End bp	6902747
Gene Length	1836 bp
Protein Length	611 aa
Translation table	11
GC content	73%
IMG OID	646389680
Product	oligopeptide transporter, OPT superfamily
Protein accession	YP_003269386
Protein GI	262198177
COG category	[S] Function unknown
COG ID	[COG1297] Predicted membrane protein
TIGRFAM ID	[TIGR00728] oligopeptide transporters, OPT superfamily [TIGR00733] putative oligopeptide transporter, OPT family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.432343
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTCTC CGCCCCCGAG CGAACCCGCG CCCCACCCCG GCGCCGAGGA GCGCATCTAC 
ACCCCCGCCG CCGATGAGGC TCAGCTCACA CTGCGGGCGC TCGTGGTCGG CTGTCTGGTG 
GGCGCGCTGT CCGGCCTGGT CAATCTCTAC CTGGGCCTCA AGACCAGCCT CACGGTGGGC 
ACCTCGCTGC TCACGGCCAT CCTCAGCATG GCGCTGCTGC CGCTGCTGGG CCGGCGCAAG 
CCCTCGACCC TCGAGGTCAA CATCGGCCAG ACCGCGGGCT CGGCCGGCGG CGCCTCGGCC 
TCGGCCGCCG GCCTGCTGGC GCCGATCCCG GCCCTGCTGC TGCTCGGCTA CGATCTCTCG 
CTGTCGGCCG CGCTGCTGTG GGCGCTGGCC ATCTCGGTGC TCGGCGTGGC CTTCGCCGTG 
CCGCTGCGCA ACCAGTACCT GGTGGTCGAG CGCCTGGCCT TCCCCTCGGG CACAGCCACG 
GCGCACACCA TCCGCTCGCT GTTCGCCGAC ACCAAGACCT CGCGCCACGC CCGCGTGCTC 
ACCATCGCGG CCGCGGCCGC GGGCACCTTC GGCCTGCTGA GCTACTTCGT GCCCGCGCTC 
GAGGCGCCCC CGTACTACGC GCTGTGGGCC GGGCCGGCGA TCGACATCGA GATCGGCGCC 
CTGGTGCTCC AGGGCGGGCT GTTCCTGGTG CTGGCGTCGT GGACTTTCGG CGTCGCGCTG 
GTGCCGGCCC TGGTCGGCGT CGGCATGCTG ATCCCGACGC ACATCTCGCT CTCGCTGCTG 
GGCGGCTCGC TGCTCGCCTG GGGGCTGCTG GGCCCGCTGG CCACGGCCGC AGGCTGGGTC 
GATGGCGCGC CCTCGGACAT GCTCACGGGA GTGGTGAGCT TCACCATGTG GCCGGGCACC 
GCGGTGATGA TCGGCGACGC CCTGGTGAGC CTGCTCTTGT CGTACAAGCT CATCTGGCGC 
TCGCTGCGTA TCTCGCGCTC CGGGCGCGAC GCAGACGACG CCGACGCGGT GCCGCGCGCG 
TGGTGGCTGG CCGCCCTGGG CGCCGGCACG GTGGGCGCGT GCGTGCTCGC GCAAGCGCTG 
TTCGGCATCC CGGTGTGGAT GACCGTGCTG GCGGTGGCGC TGTCGGCCGT ACTGGCCGCG 
GTGTCCACGC GCTCGGCCGG CGAGACCGAC ATCAACCCGG TCGGCATCAT CGGCCAGGTC 
ACCCAGGTGA GCGTCGGCAG CATGGCGCCG GGCGCGGCCG CCACCAACCT CATGACCGGT 
GCGATCACGG TCGCGGGCGC CGACGCGGCC GCCGACCTGA TGCAGGATCT CAAGACCGGC 
CAGATGCTCG GCGCGTCGCC GCGCAAGCAG TTCGCGGCCC AGATCTGCGG CATCATCGCC 
GGCGTGCTTG TGGTCGTGCC CGCCTTCTTC CTGTTCCGCG AGAACTACGA CATCGGCGCC 
AGCACCGCCA TGCCGGCTCC GGTGGCCCAG CTCTGGACCG CGGTCTCCAA GGTCATCACC 
AGCGGCGCCG ACAGCCTGCC GCAGCCGGCC TTCGTCGCCG CCGTGATCGG CGGCCTGCTC 
GGCGCCGCGT TGGCCGTGGG GCGCGCGCTG TGGCCGCATC GCAAACACTG GTTTCCCAGC 
GGCCTGGCCG TGGGCATCAG CTTCCTCTTG CCCGCGCTCT TCGCCGTCGG CATCTGCCTG 
GGCGCCGCGG TCGTGGCGCT GTGGCGGCGC TGGCGGCCGG CGCAGGCCGA GGCCCTGTTC 
ATGATCGTCT CCTGCGGCCT GCTGGCCGGC GACGGCATCA TGGGCGTCAT CAAAGCGCTC 
ATGCAGGTGC TCGGCGTGCC CCCGCTCGTC GGCTGA

Protein sequence

MTSPPPSEPA PHPGAEERIY TPAADEAQLT LRALVVGCLV GALSGLVNLY LGLKTSLTVG 
TSLLTAILSM ALLPLLGRRK PSTLEVNIGQ TAGSAGGASA SAAGLLAPIP ALLLLGYDLS 
LSAALLWALA ISVLGVAFAV PLRNQYLVVE RLAFPSGTAT AHTIRSLFAD TKTSRHARVL 
TIAAAAAGTF GLLSYFVPAL EAPPYYALWA GPAIDIEIGA LVLQGGLFLV LASWTFGVAL 
VPALVGVGML IPTHISLSLL GGSLLAWGLL GPLATAAGWV DGAPSDMLTG VVSFTMWPGT 
AVMIGDALVS LLLSYKLIWR SLRISRSGRD ADDADAVPRA WWLAALGAGT VGACVLAQAL 
FGIPVWMTVL AVALSAVLAA VSTRSAGETD INPVGIIGQV TQVSVGSMAP GAAATNLMTG 
AITVAGADAA ADLMQDLKTG QMLGASPRKQ FAAQICGIIA GVLVVVPAFF LFRENYDIGA 
STAMPAPVAQ LWTAVSKVIT SGADSLPQPA FVAAVIGGLL GAALAVGRAL WPHRKHWFPS 
GLAVGISFLL PALFAVGICL GAAVVALWRR WRPAQAEALF MIVSCGLLAG DGIMGVIKAL 
MQVLGVPPLV G