Gene Hoch_3444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3444
Symbol
ID	8545832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4756532
End bp	4757611
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	73%
IMG OID	646388111
Product	Threonine aldolase
Protein accession	YP_003267839
Protein GI	262196630
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0251232
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACTG TCATCGATCT TCGCTCCGAC ACGGTCACCC AGCCCACGGC CGAGATGCGC 
CGCGCCATGG CCGAGGCCGT GGTCGGCGAC GACGTCTACG GCGAGGACCC CACGGTCAAT 
CAGCTCCAGG AGCGAGTCGC CGCGCTCCTG GGCACCGAGG CGGCCCTGTT CGTGCCCTCG 
GGCAGCATGG CCAACCAGAT CGCCATCAAG GTGCACACCC AGCCCGGCGA CAGCGTCATG 
GTCGGCGCCC ACGCCCACAA CTGGCTGTTC GAAGCCGGCG GCGCCGGCGC GATCTCGTCG 
GTCCAGGTCG ACGTCCTGCC CGGCGACGGC CGCTTTGACG CCGCCGCCAT GCGCGAGTCC 
TACAAGCCCG ACAATCACCT GTTCGCGCCC ACGCGCCTGG TCTCGGTCGA GAACACGCAC 
AACATGGGCG GCGGCCTGGT GTGGGACGAC GAGCCTCTGG CCGCGGTGCT GGCGTGTGCG 
CGCGAGCTCG AGCTGGGCAC GCACCTCGAC GGCGCCCGGC TGTGGAACGC GGCCGCGCGC 
ACCGGCCGCT CCGAGGCCGA GCTGACCGCC GGCTTCGACA CCATCGCGGT GTGCCTGTCC 
AAGGGCCTGG GCGCGCCCGT GGGCTCGCTG CTGTGCGGCA CCCGCGCGCT GGTCCACAAG 
GGTCACCGGG TGCGCAAGAT GCTCGGCGGC GGCATGCGCC AGGCCGGCAT CCTGGCCGCG 
GCCGGGCTGT ACGCGCTCGA GCATCACCGC CCGGGCCTGA CCCAGGACCA CGACAACGCC 
CACTACCTGG CCGCGGAGCT GGCCGCGGTG CCCGGCTTCG CGGTCGATGT CGCGCGCGTG 
CACACCAACA TCGTCATGGT CGACGTCGTC GACAGCGCGC TCGACGCCCA GCGCATCGCG 
GCCGCCGCGG CCGAGCGCGG CGTGCGCGTC CACGGCATGT CGCCGCGGCG CATGCGCCTG 
GTCACGCACC GCGAGCTCGA CCGCGCCATG TGCACGCGCG CGATCGAGAC CCTGGCCGCG 
CTGGCCGGCG CTCCCGGCTC GGCATCGTCG AACGCGGCGA CGCGCGCCGC CCATGGCTGA

Protein sequence

MTTVIDLRSD TVTQPTAEMR RAMAEAVVGD DVYGEDPTVN QLQERVAALL GTEAALFVPS 
GSMANQIAIK VHTQPGDSVM VGAHAHNWLF EAGGAGAISS VQVDVLPGDG RFDAAAMRES 
YKPDNHLFAP TRLVSVENTH NMGGGLVWDD EPLAAVLACA RELELGTHLD GARLWNAAAR 
TGRSEAELTA GFDTIAVCLS KGLGAPVGSL LCGTRALVHK GHRVRKMLGG GMRQAGILAA 
AGLYALEHHR PGLTQDHDNA HYLAAELAAV PGFAVDVARV HTNIVMVDVV DSALDAQRIA 
AAAAERGVRV HGMSPRRMRL VTHRELDRAM CTRAIETLAA LAGAPGSASS NAATRAAHG