Gene Amir_4090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_4090
Symbol
ID	8328283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	4805992
End bp	4807317
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	77%
IMG OID	644944555
Product	glycosyl transferase family 2
Protein accession	YP_003101792
Protein GI	256378132
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.157958
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGGCC ACGTGCCCGC GCAGCGGTCC CCCCAGGACG AGCCGCCCGA ACCACCCCCC 
GACGGCCCGT CCCGCCCGAT CCCGGTCGGC GCCCTGCCCG GTGCGGCGCT GATCGGCGGC 
GCCGCGCTCG CGGACCCGGT GCTGCTCGGC GCCGCGCCCG CGGACCCGGT GCTGCTCGGC 
GCCGCGCCCG CGATCCCGGC GCTGCTGGAC GCGGTGCTGC CCGACGACCT GCTGCCCGAC 
GACCTGCTGC CGGACGACCT GCTGCCCGCG CCCCTCCCAC TGGACGTGGT GCTGACCGAC 
GTGGTGCTCT CGGAGGACCT GCTGCCCGAC GACCCCCTGC CCGACACCCT CCTGCCCGAC 
ACCCTCCTGC TGCCCGCCGA ACCGCTCGCC GCCACGCCCC ACCCCGGCCG CCCGAGACCC 
GCCCCGCACC CGCTGTCGAC GGTCACCGTC GACCTGGTCA TCCCGGTCTT CAACGAGGAG 
CGCGCCCTCC CCGGCTGCGT CGCCACCCTG CACGACTACT GCACCCGGCG GCTGCCGTTC 
GACTGGACCA TCACCATCGT CGACAACGCC AGCACCGACA CCACCCGCCA CGTCGCCCAG 
GACCTGGCCG GGCACTGGCC GAGGGTGCGC GTCGTGTCGC TCGACCGGCG CGGCAAGGGC 
AACGCCGTGC GCACCGCGTG GACCGGCAGC AGCGCGGGCG TGGTCGTCTA CATGGACGTC 
GACCTGTCCA CCGGGCTGGA CGCGCTGGTC CCGCTCGTGG CCCCGCTCGC CGTCGGCCAC 
TGCGACCTCG CCATCGGCTC GCGGCTCGCG CCGGGCGCCC GCACCGTGCG CGGCGCCCGG 
CGCGAACTGC TGTCCAGGGG CTACAACGCC CTCATCAGGC TCACCCACGG CACCCGCTTC 
CGGGACACCC AGTGCGGCTT CAAGGCCGCG CGGGCCGAGG TCGTCGGACC GCTGCTGCGC 
CGGGTCAGGG ACGACTCCTG GTTCTTCGAC ACCGAGCTGC TGCTGCTCGC CGAGCACAAC 
GGGCTGCGCG TGCTGGAGGT CCCGGTCGAC TGGGTGGAGG ACGTCGACAG CCGGGTCGAC 
GTCACCGGCA CCATCGCGGG CAACGTGCGC GGCCTGGCCA GGGTCGCCCT GGCCAAGCTC 
TCCGGCGCCG CCGCCGTGAC CGACCTGCCG ACCCGACCGG CCCCCGGACC GACCCACCCC 
GACGCCGTGC TGCGCGACCG GCCCCGGTCC CGCCGCCCGT GGCTGCGCTG CCCACGACCG 
GGCGCCCGGC GGCGGCGCGC GCTGCCCCCG CCCGGCCACC ACCCCGCCAC CCCCGCCTCC 
GGCTGA

Protein sequence

MDGHVPAQRS PQDEPPEPPP DGPSRPIPVG ALPGAALIGG AALADPVLLG AAPADPVLLG 
AAPAIPALLD AVLPDDLLPD DLLPDDLLPA PLPLDVVLTD VVLSEDLLPD DPLPDTLLPD 
TLLLPAEPLA ATPHPGRPRP APHPLSTVTV DLVIPVFNEE RALPGCVATL HDYCTRRLPF 
DWTITIVDNA STDTTRHVAQ DLAGHWPRVR VVSLDRRGKG NAVRTAWTGS SAGVVVYMDV 
DLSTGLDALV PLVAPLAVGH CDLAIGSRLA PGARTVRGAR RELLSRGYNA LIRLTHGTRF 
RDTQCGFKAA RAEVVGPLLR RVRDDSWFFD TELLLLAEHN GLRVLEVPVD WVEDVDSRVD 
VTGTIAGNVR GLARVALAKL SGAAAVTDLP TRPAPGPTHP DAVLRDRPRS RRPWLRCPRP 
GARRRRALPP PGHHPATPAS G