Gene Hoch_3197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3197
Symbol
ID	8545585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4406845
End bp	4408038
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	69%
IMG OID	646387864
Product	hypothetical protein
Protein accession	YP_003267592
Protein GI	262196383
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.111821
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTGGT TTCGTTTCCC CCTCGTGGCG TCGCTGTTGC TGCCGCCGCT GCTGTTCGCG 
AGCGCGCAGC CGGCCGCGGG CCAGCCGGCC GCCTTTCCGC TCGAGGATGA CGCCGCGGTG 
GCGCTGCCGC CGCTGCCCGG AATTCCGCTG CTGCCGAGCA CGGCCGTGGT GGCGCTGCCG 
CCGCAGCCGC AGCCGCCACC GGCGCCGGTG AGCCTCGCGC TCGCGGCCGA GGGCGAGGCC 
AACGTGACCA CGGCCAGCGC GGAGACGAGC GCGGACTTCG ATGACGATGT CGAAGGCGAG 
GGAGAAGGCG AGGGCGAAAG CGGCCTCACG ACTGGCAAGA TCGTGAGCGC CAGCATCATC 
GGCGGCATCC ACGCGACGCT GTACACCTGG GCGTATTTCG CCTGGTATCG GCCGCGCACC 
AAATACGACG AGCTGACCTT TATCGACGAG GGCTGGTTCG GTCCCGGCAC CTACGCGGGC 
GGCGCCGACA AACTCGGCCA CTTCTACTCC AATTACCTGT TCGTGCGCGG CACCGTGGGT 
GTGCTCGAGG CCGGCGGCTG GGAGCGCAAG TGGGCGCTGC CGGCCTCGCT GGCGCTCACG 
CTCAGCTTCT TCACCGCCAT CGAGATCAAG GACGGCTACC ACAAGGGATT TGGCTTCTCG 
CTCCAGGACA TCACCGCCAA CCTCTCGGGC AACGCGCTGG CCGCGCTGCT CTTGGCGGTG 
CCCGCCATCG ACCGCGCCAT CGACCTGCGC ATCGAGTATT TGCCCAGCAA GGCGTTCCGC 
GACGAGCTGC GCATGGGCGG GGTCGACGCG GCCGAAGACT ATACCGGACA GTCGTTCGTA 
CTCGCCTTTC ACCTGGGCTC GATCGAGCCG CTGCGGCGCT CGCGCTACCT GGGCTGGACG 
CAGTACGTCG ACGTGGTCGG CGGCTACCAG GCGCGCAACT ACAAGCCCGC GCCCGCCGAC 
CCCAGCGCCG AGCTGCCGAC GCAGGAGCTG TATTTCGGAC TAGCGCTCGA CATGCAGGCC 
GTGATGCGCG CCTGGGACCG CTCGGTGTCT TCGCCCGGGT GGTCGAACGC CATCGACACC 
ACGCGCGCGA TCTTCGAGTT CGTCCAGGTG CCCTACACCA CGCTCGAGCT GGTCGACGCC 
GAGCGCGTCA ATCCTCCGGT GACGGACGAG TCCAGCGCCG GACTGCGCTG GTAA

Protein sequence

MSWFRFPLVA SLLLPPLLFA SAQPAAGQPA AFPLEDDAAV ALPPLPGIPL LPSTAVVALP 
PQPQPPPAPV SLALAAEGEA NVTTASAETS ADFDDDVEGE GEGEGESGLT TGKIVSASII 
GGIHATLYTW AYFAWYRPRT KYDELTFIDE GWFGPGTYAG GADKLGHFYS NYLFVRGTVG 
VLEAGGWERK WALPASLALT LSFFTAIEIK DGYHKGFGFS LQDITANLSG NALAALLLAV 
PAIDRAIDLR IEYLPSKAFR DELRMGGVDA AEDYTGQSFV LAFHLGSIEP LRRSRYLGWT 
QYVDVVGGYQ ARNYKPAPAD PSAELPTQEL YFGLALDMQA VMRAWDRSVS SPGWSNAIDT 
TRAIFEFVQV PYTTLELVDA ERVNPPVTDE SSAGLRW