Gene Hoch_1778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1778
Symbol
ID	8544160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	2456019
End bp	2457098
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	71%
IMG OID	646386485
Product	L-asparaginase, type I
Protein accession	YP_003266220
Protein GI	262195011
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00519] L-asparaginases, type I

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.285439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.276697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCGG TTCCCAACAT CCTCCTCATC TACACCGGCG GCACCATCGG CATGCGCAAG 
ACCCCGGCCG GCTACCAACC CGAGCCCGGC TCGCTGCAGC GCCTGCTCAG CGAGCTGCCG 
CGCTTCTCCG ATCCCGACGT GCCCCACTTC GACATCGCCG AGTTCGCGCC GCTGCTCGAC 
AGCGCCGATA TGAACCCCTC ACACTGGCTG CGCATCGCCG AGATGGTGCG CGACAACTAC 
GAGGACTACG ACGGCTTCCT GGTGCTGCAC GGCACCGACA CCATGGCCTT CACCGCCTCG 
GCGCTGTCGT TCATGCTCGA GCGCCTGGCC AAGCCCGTGC TGCTCACCGG CTCGCAGATC 
CCGCTCGAGG AGACCCGCAA CGACGCCCAG AACAACCTGC TCACCGCGCT CACCATCCTC 
GGCCGCGACC ACGCCCGCCT GCCCGAGGTG CTGATCTACT TCGCCGGCCT GCTGCTGCGC 
GGCAACCGCG CCACCAAGGT CTCGGTCGGC GAGTTCGCGG CCTTCGAGTC GCCCAACTTC 
GCGCCCCTGG GCCGCGCCGG CATCGACATC GACATCGACT GGCGGCGCGT GCTGCCGCCG 
CGCGCGCGCG CCAGCGAGGC CGTGCAGGTG GTCCCGGTCG GCAGCGCCAA CGTGGCCGCC 
TTCCGCCTGT TCCCCGGGCT CAAGCCGGCG CTGCTCGAGG CCGTGCTCGC GGCCCCGGTG 
CAGGGCGTGG TGCTCGAGTG CTACGGCGCC GGCAACGCGC CCACGGCCGA TCCCGCGTTC 
ATGCGCGTGA TCGCCGAGGC CACGGCCCGC GGCGTGGTCC TGGTCGATGT CTCGCAGCCG 
CTGCGCGGCT CGGCCGATCT GCGCCTGTAC GCCACCGGGC GCGCGCTGCT CGACGCCGGC 
GTGGTCGGCG GCTACGACAT GACCGCCGAA GCCGCGCTGG CCAAACTCGC CTACCTGTTC 
GAAAAAGGCC ACGGCCCCGA GCGCGTCAAG GAGCTGGTGC AGACGCCCCT GGTCGGCGAA 
CTCACGCGCG CCGACGTGCC CACCTGGACG CCCTTCCGGG CCGTGGATCG CGACTCCTGA

Protein sequence

MSAVPNILLI YTGGTIGMRK TPAGYQPEPG SLQRLLSELP RFSDPDVPHF DIAEFAPLLD 
SADMNPSHWL RIAEMVRDNY EDYDGFLVLH GTDTMAFTAS ALSFMLERLA KPVLLTGSQI 
PLEETRNDAQ NNLLTALTIL GRDHARLPEV LIYFAGLLLR GNRATKVSVG EFAAFESPNF 
APLGRAGIDI DIDWRRVLPP RARASEAVQV VPVGSANVAA FRLFPGLKPA LLEAVLAAPV 
QGVVLECYGA GNAPTADPAF MRVIAEATAR GVVLVDVSQP LRGSADLRLY ATGRALLDAG 
VVGGYDMTAE AALAKLAYLF EKGHGPERVK ELVQTPLVGE LTRADVPTWT PFRAVDRDS