Gene Amir_4360 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_4360
Symbol
ID	8328557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	5152509
End bp	5153840
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	80%
IMG OID	644944824
Product	glycosyl transferase family 28
Protein accession	YP_003102057
Protein GI	256378397
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000448703
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCGTCC TGTTCACGCC GCTCCCGGTG GACCCGAGCC TGCGCGGCCT GGCCCCGCTG 
GCCTGGGCGC TGCGCGCCGC CGGTCACGAG GTGCGCGTCG CGGTCCGCCC CTCGGGCGTG 
GAGGCGGTCA CCGGTGCGGG CCTCACCGCC GTCCCGGTCG GCGACCGCGG TGACGCGCCC 
ACCCCGATCC CCGCGCAGGG CGGCAGGCCC GACGGCGGCG ACCGCCTGCT GCACCTGGAC 
GACGCGCTGC TCGACGACCT GCTCGACTTC GCCGAGACCT GGCGACCGGA CCTGCTGGTG 
TGGGACCAGG CCGTGCTCGC GGGCCCGGTG GTGGCGAAGC TCCTCGGCGT CCCGCACGTG 
CGCGTCCCGC ACGCCGTCGA CGTCGTCGGC CTGCACCGCG CGGGCCTGGC CCCCGACCAC 
CCGGACGGCC TGACCGCCAA GCTCGGCGCG GCCCTGGCCC GCAGGGGCGC GGTGTTCACC 
GAGGACGTCG CGGTCGGCGA CCTCACCGCC GACCAGCTCC CACCGGGCAC CCGCCCACCC 
GTCGACCTGG ACCACCTGCC ACTGCGCCCC ACCCCGCACG ACGGCCCGGC CGAACTCCCG 
GACCACCTGC GCGAACAGCC GGCGGGCCCG CGCGCCCACC CCGCCCCGCG CGACGATCCG 
GCCGAACCGC CCGCCGCCCC GCGCGCCCAC CCCGCCCCGC GCGCCCACCC CGCCCCGCAC 
GACGGCCCAG CCGAACCGCC ACCCCGCCCC CGCCCCCGCG TCTGCCTGGC CCTCGCCCGC 
CCCGACCGCG AAGGCGGCCT CACCCCCGCC GAGCGCGCCA CCGCCGAGGT CCTCGTCCGG 
GGCGCCACGC GGCTGGACGT CGAGCTGATC GCCCTGCTGC CCACCGGATC GCCCCCGCTC 
CCGCCACCCG CCACCACCCA CCCGCACGAC CACGAGCCCC CGCGGGAACT CCTCCGCGCC 
TGCGCCGCGA TCGTCCACCG CGGCGACCCC GCCACCACCT CCGCCGCCAC CGCCGCGGGC 
CTGCCCCAGC TCGTGGCCCC CGGCGGCGCC TGGGACGAGC CGAACCTCGC CGCCCTGCTC 
GCCGACCGGG GCGTCGCCCT CGTCCTGGAC CGCACCCACC TCACCGAGGA CGCCGTGGCC 
GAGCACCTCC TGCGCCTGCT CGACGAACCC GCGTTCACCG ACCGCGCCGA GGCCCTGCGC 
GCGGACGTCC TCGCCCAGCC GACCCCGCAC GACGCCGTGC ACCGCCTGGA GGACCTGGTC 
GCCGAGCGCA CCGGACGGGT GGTCCCGTGG GCGCGCGGCG CGAGGCCCGG TCGAACGGCG 
GCCCGGCGCT GA

Protein sequence

MRVLFTPLPV DPSLRGLAPL AWALRAAGHE VRVAVRPSGV EAVTGAGLTA VPVGDRGDAP 
TPIPAQGGRP DGGDRLLHLD DALLDDLLDF AETWRPDLLV WDQAVLAGPV VAKLLGVPHV 
RVPHAVDVVG LHRAGLAPDH PDGLTAKLGA ALARRGAVFT EDVAVGDLTA DQLPPGTRPP 
VDLDHLPLRP TPHDGPAELP DHLREQPAGP RAHPAPRDDP AEPPAAPRAH PAPRAHPAPH 
DGPAEPPPRP RPRVCLALAR PDREGGLTPA ERATAEVLVR GATRLDVELI ALLPTGSPPL 
PPPATTHPHD HEPPRELLRA CAAIVHRGDP ATTSAATAAG LPQLVAPGGA WDEPNLAALL 
ADRGVALVLD RTHLTEDAVA EHLLRLLDEP AFTDRAEALR ADVLAQPTPH DAVHRLEDLV 
AERTGRVVPW ARGARPGRTA ARR