Gene Amir_3864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_3864
Symbol
ID	8328056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	4529109
End bp	4530809
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	75%
IMG OID	644944351
Product	protein of unknown function DUF181
Protein accession	YP_003101589
Protein GI	256377929
COG category	[S] Function unknown
COG ID	[COG1944] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00702] uncharacterized domain [TIGR03604] bacteriocin biosynthesis docking scaffold, SagD family

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000134117
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGACG TCGAGGTCGT GGAGCTGACC GGGTACGCGC TGGGCGAGCT GGAGCGGCTC 
GGGGTGGACG GGCCGGTGCT GCCGGTGCGG TTCGACGGCG CGCTGGTGCT CGTGGGGCCG 
GTGCTGGACG GGAGCGGGGT GTGCCTGCGG TGCGCCGAGG ACGCCCGGCT CGCGGCGCTG 
GGGGCGGTGG TGCCGCGTGC GGACCCGGCG ATGCGGGTGG GTGGTCTGGT CGTCCCCGCG 
CTGCGGCCGG TGCTCGACGC GCTGGTGGAG CGCGTGCTGG CCGATCCCGG CGCCCATCGT 
GATCGGGTGC TGGCCCTGCG GTCGGACCTG GGCGCGGTTG GCGAGCACCG GGTCCGGCCG 
AGGCCCGAGG GGTGTGCGAG GTGCGGGCCG CTGCCCGAGG ACTCGGCGGA GGCCGCGAGC 
GTGGTGCGCG CGCCCGTGCC GGTGGAGCCG GGGTCGTTGC GCGGTGAGAA CGCTGCGACC 
GCAGGGGATT CGGTGCGCCG CGAGCTGTTC GACCTGCGGC ACGGGCCGGT GGGTGGGCTG 
CACCGGATCG GGGACCTGGT CGTGGCGGCG GTGAGCGCCG AGCTGGTGGG CGGGCAGGCC 
GGGTTCGGGC GCACGGGCGA TTACGAGCAC GCCGAGCGGG TGGCGCTGTT CGAGGCGGTG 
GAGCGGCACG CCGGTCTGCG GCCGAGGCGG GTCACCACGG TGGTGGAGGC CTCGTTCGCC 
GAGCTGGGGC CCGACCGGGC GCTCGACCCG GTGCGGTTGG GGTTGCCCGA CCTGGAGTCG 
CCGCACGTGA CGCCGTACCG GCCGGACGTG CGGATCCGCT GGGTGCACGG GTGGTCCTAC 
ACGCGGGGGC GGGCCGTGGC GGTGCCCGAG CACGTCGCCT ACTGGGGGCG GGCGATCGGG 
CCGAGGTTCG TGGACGAGAC GTCCAACGGG TGCGGCACGG GCAACAGCCT CACGGAGGCG 
GTGCTGCACG GGCTGTTCGA GGTCGCCGAG CGGGACGCGT TCCTGACCGC CTGGTACGGG 
CGGGTGCCGT TGCCGTCGCT GCGCTCGGAC GACGGGCTGA CCGCGCACGT GGCGGACCGG 
TTGGAGCAGG TGGGGTATCG GCTGGAGCTG TACGACGCGA CGAACGACCT CGGGGTGCCG 
TCGGTGCTGT CGTTGGCCCG GCGGGTGGAG GGGCGGGGTG GGTTCCCGTG CGCGTTCTAC 
GCGGCGGGGG CGGGGTTGGA CGTGGAGGCG GCGGTGCGGG CCGCGGCGGC CGAGGTGGTG 
ATGGACGTGG AGGCGGGGGC CAAGCGGTAC CGGAGCGAGC CTGGGGACTA CGAGCTGGAG 
CGGTTGCGGC GGATGCTCCG CGAGCCCCGG CTGGTGCGGA CGATGGACGA CCACGTGAAC 
GTCAACGCGT TGCCGGAAGC GTTGGGGCGG CACGACTTCC TGGTTCCGGG GCCGGGGCGG 
GAGCTGGTGG CGCCGGACGT GCCGAGCGGT GATCTCGACG CGCTGCTGGA GCACTACGTG 
CGGCGGTGGG AGGCGTTGGG GCTGGAGGTG ATCGCGGTGG ACCAGAGCGA TCCGGTGGTG 
CGGGAGCGGT TGGGGTTGTG CTCGGCGAAG GTGATCGTGC CGGGGGCGGT GCCGATGACG 
TTCGGGGAGG TGAACCGGCG CACGGGTGGC ATACCCCGGC TGCGCCTGTC CGGTCCCCCG 
CTGCCGCACC CGTTCCCGTG A

Protein sequence

MSDVEVVELT GYALGELERL GVDGPVLPVR FDGALVLVGP VLDGSGVCLR CAEDARLAAL 
GAVVPRADPA MRVGGLVVPA LRPVLDALVE RVLADPGAHR DRVLALRSDL GAVGEHRVRP 
RPEGCARCGP LPEDSAEAAS VVRAPVPVEP GSLRGENAAT AGDSVRRELF DLRHGPVGGL 
HRIGDLVVAA VSAELVGGQA GFGRTGDYEH AERVALFEAV ERHAGLRPRR VTTVVEASFA 
ELGPDRALDP VRLGLPDLES PHVTPYRPDV RIRWVHGWSY TRGRAVAVPE HVAYWGRAIG 
PRFVDETSNG CGTGNSLTEA VLHGLFEVAE RDAFLTAWYG RVPLPSLRSD DGLTAHVADR 
LEQVGYRLEL YDATNDLGVP SVLSLARRVE GRGGFPCAFY AAGAGLDVEA AVRAAAAEVV 
MDVEAGAKRY RSEPGDYELE RLRRMLREPR LVRTMDDHVN VNALPEALGR HDFLVPGPGR 
ELVAPDVPSG DLDALLEHYV RRWEALGLEV IAVDQSDPVV RERLGLCSAK VIVPGAVPMT 
FGEVNRRTGG IPRLRLSGPP LPHPFP