Gene Hoch_6557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_6557
Symbol
ID	8548974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	9001041
End bp	9002561
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	70%
IMG OID	646391219
Product	peptidase S37 tripeptidyl aminopeptidase
Protein accession	YP_003270918
Protein GI	262199709
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.776042
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.232019
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGCCC GCGCCCCTTG GAGTTCGTCG CAGTGCGCCC CGCGGCGCGA TCGTTCAGCC 
GTCCGCCGGC CGTGCGCGCG CGTCGCCCAC GCCGCGGCGC ACGCGTGTCT GCTGGCGTGT 
CTGGCCGCGT CTGTGCTCGC GTGCACGGGC CCCGAGTCCG GCGACGATGA GCGCGACATC 
GCCGAGCTGC TGGCCGAGGT GCCCGGGTTC GTCGCCGTCG AAGAGCTGCC CGCGCGTCCC 
GGCAGCTACG GCCGCGCGTT CGCGATCGTG CTCGAGCAGC CCGTGGATCA CGCCGCCGCT 
GAGGGCGCGC GCTTCCAGCA GCACATCACC CTGGCGCACG TCGATCGCGA CGCGCCCATG 
GTCCTGGCCA GCACCGGCTA CCATAATTAC CTGGGCACCA CGCCCAGCGA GCCCACGTAT 
CTGCTCAACG CCAATCAGGT GGCGGTTGAG CATCGCTACT TCGGCGACTC GCGGCCCGAG 
CCGACAGACT GGAGCTACCT CACGGTCGAG CAGGCGGCCG CCGATCACCA CCGCGTGGTC 
GAACTCTTGC GGCCCATCTA CAGCGGCGAC TGGGTGTCCA CCGGCCTGAG CAAGGGCGGC 
GTCACCTCGC TTTTGCACCG CCGCTACTAT CCCGACGACG TCACCGCGAC CGTGGCCTAC 
GTCGCGCCCG TGAGCTTCTC GGTCTTCGAC GAGCGTTACC GGACGTTTTT CGACGACCTG 
GACGAACAAC TCGCCGAGAT CAGCGACGGT CCGGCTTGCA AGCAGCGCGT GCGCGACCTC 
CAGCGCGAGC TGCTGCTGCA CCGCGACGAG GTCGAGGACT TCTTCGCCGA GCAAGCCGCC 
CTGGTAGAGT CCAGCTTCGA GCGCGTCGGC GGATTGCAGC GCGTGCTCGA GGTCGCCATC 
GTCGAGATGG AGTTCAGCTA CTGGCAGTAT TTCGGCCTCG ACTCGTGCTC CGGCACGCCC 
GGAGCGAGCG CGCCGCTCGA GTCGATGGCC GGTTTCCTCG CCCTCGTCAA CGATCCCCTG 
GGCATGGCCG ACGGCAGCAC CGCGCTGTTC GAGCCCTACT ACTATCAGGT GCTCACCGAG 
CTCGGCTATC CGCTCGTGCC CCTGGCGCAC ATCGAGGATC TGCTCATCTA CGACTACGCC 
GAGAGCCTGC ACTACTTCCT GCCCGAGGAG GTCGAGATGC AGCAGCCGGC GCCGCCATTC 
GACCCCGCGC CCATGCGCGA GCTCTTCGAC TGGGTGCGCG ACCAGGGCGA GCGCGTGATC 
GTGGTCTACG GCGGGCAAGA CCCGTGGACC GGCGGCGCGT TCGAGCTCGC CGGCGACGAC 
ACCGCGTTCG TCGTGCTGCC GAGGGAGAAC CACGGCGCGC AGCTCCTGAA CTCCAACGAC 
CGCAGCGCGG TGCAGCTACT CCAGTCCTGG GTGCCGCCGT TCCAGGCCAA CACCGGGGCG 
AACCGCGACG CCGGTGTGGC CCCGGCCGTG CGCAGCCTCG GCACCGAGCT ACCGCGCCCG 
CGCCCGCGCC TGGGCTGGTG A

Protein sequence

MLARAPWSSS QCAPRRDRSA VRRPCARVAH AAAHACLLAC LAASVLACTG PESGDDERDI 
AELLAEVPGF VAVEELPARP GSYGRAFAIV LEQPVDHAAA EGARFQQHIT LAHVDRDAPM 
VLASTGYHNY LGTTPSEPTY LLNANQVAVE HRYFGDSRPE PTDWSYLTVE QAAADHHRVV 
ELLRPIYSGD WVSTGLSKGG VTSLLHRRYY PDDVTATVAY VAPVSFSVFD ERYRTFFDDL 
DEQLAEISDG PACKQRVRDL QRELLLHRDE VEDFFAEQAA LVESSFERVG GLQRVLEVAI 
VEMEFSYWQY FGLDSCSGTP GASAPLESMA GFLALVNDPL GMADGSTALF EPYYYQVLTE 
LGYPLVPLAH IEDLLIYDYA ESLHYFLPEE VEMQQPAPPF DPAPMRELFD WVRDQGERVI 
VVYGGQDPWT GGAFELAGDD TAFVVLPREN HGAQLLNSND RSAVQLLQSW VPPFQANTGA 
NRDAGVAPAV RSLGTELPRP RPRLGW