Gene Amir_3984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_3984
Symbol
ID	8328177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	4667269
End bp	4669086
Gene Length	1818 bp
Protein Length	605 aa
Translation table	11
GC content	77%
IMG OID	644944458
Product	PBS lyase HEAT domain protein repeat-containing protein
Protein accession	YP_003101695
Protein GI	256378035
COG category	[C] Energy production and conversion
COG ID	[COG1413] FOG: HEAT repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.187514
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGAAAGA TCGACTGGCA GTCCCTGGAA TGCCTCCACG GTCCCGCCGG GAACGTGCCG 
GACCTGCTGG AGGAGTGCGC GCACGAGGAC CCGCTCCACG CGTTCGGCGC GATCGCCGAC 
CTGGGCGACC TCCTGCGCCC CTCCCGCGCC CGAATCCTCT CCGCAGCCCC GGCGGCGCTC 
CCGTTCCTGG TCGACCTGGC CGAGAACGGC CCGCACGCGC GCGAGCGGGT CGTGCGCCTG 
ATCCGCCAGA TCGCCGAACG CGGCCACCCC ACCCCCGAGT GGACCGGGGC CCTGGACGCG 
GCCCGGCCCG GCCTCCTCGC CCTCCTCACC GACCCGGACC CGCTGGTGCG CCGCCAGGCG 
GGCAGGCTCC TGTCCTGCCT GGACCACCCG GAGGCCCTGA CCGCCCTGCG CGAGGGCTGG 
GACACCGAGC AGGACCTCCG CGTGCGCTGC GACCTGGTGC GCTCCCTGGG CGGAGCGGAC 
CCCGCCTTCG ACCTCACCGC ACTGCTCACC CACGACGACC CGCAGCTGTG CCTGGCAGCG 
GCCCACGCCC TGCCCGCCAC CGCCGCGCTC CCCGACGCGA CCGCGCTGGC GAACGCCGTG 
GCCTCACCGG ACAGCGCGGT GTGGGTCGAC TCCGCCTGGC TGGAAGATCC CCGCCACGAC 
GACGCCCTCA CCGAGCTGGT CATCACCACC GGCGACCTCC TCGCCGAGGA CCCCGCCGCC 
CTGACGGGCT ACGTCACCCT GGTGGCCCGC AACGGCATCG CCCCCCGCCG CGCGGCGGTC 
CTTGGCTCAG CCCTGCGCCT GCTCTGCACC TGGCGCGACG TGGACCTGGT CCCCCTGCTG 
GGAACCCTCC TCCACGACCC CCACCCCGCG GTCCGCTACC GAGCCGCGGC GGTCCTGGCC 
TGCCTGGGCC CAGCCGCGCG CCCCCACGCC GACCGCCTGG CGGCCCTGCT CCAGGACCGG 
TCGGAGCAGC CCGGCGAGTC GACCACGCAC ACCGCGGGCG ACATGGCCCT GTGGGCGCTG 
GCGGCCCAGG GCGACCCGCG CTGCGTCCCC GCGCTGGTCG CCCTGCTGGA GAGCGACCGC 
GTCCCGTTCG ACCTGAACAC CCACCGCCCC ACGAACCCCA CCCCCGTGAC CGCCTGCGGC 
CCCTGGCTCC ACGAGCCCAC CGCCGAGGAG GTCCTCACCC CGCTGCGCGC GCACGCCGCC 
GCCCTGGTCC CCCCGATCGC GGCCCGCCTG GCACGCCCCG ACCAGCACCG CCTGCTGGTG 
GCGGCCCTGT GCCGGGTCCT GGCAGCCTGG GGCCCGCTCT CCGGCGAGGC CAAGTCCGCG 
CTGGAACCCC TCACCGGCCA CCGCTACTAC GGCCGCTACG CGACGGCGGC CCTCAAGTCG 
ATCGACGGCT ACACCGAGGC CGACGTCCCC GCCCTGGCGG GCGAGGCCCG CCGCTCCGGC 
GTCACGATCG GCGTTCTGGG CGCGCTGGGC GCCGCGGCAG CGGAGGCCGA GGACACCCTG 
CGCCGTCTGG CCACCCCGGA CGAAACGGCC TGGCGCCGCG TGGAGGCGTC CTACGCCCTG 
TGGCGCGTCA CCGGCGAGAC CACGACCGCG GTCCCCCTCC TGCTGGAAGC CGCCGCTCCC 
CTGGCGACCG GTGACTACAC CCGCCCGCGC GGGGCGGCCC TGCACCACCT GGCGGAGATC 
GGCGTGCGCA CCGAGGAGGT CCTCGCCACC GCCCGAGCCG TGGCCACCAC CCGCCGCCGG 
GTGGCGAACG TCGGCGACCG CGAGCGGATC GCCGAGGACG AGGCGCTGCG GGCATCAGCG 
GCCCAACTGC TCGGATGA

Protein sequence

MRKIDWQSLE CLHGPAGNVP DLLEECAHED PLHAFGAIAD LGDLLRPSRA RILSAAPAAL 
PFLVDLAENG PHARERVVRL IRQIAERGHP TPEWTGALDA ARPGLLALLT DPDPLVRRQA 
GRLLSCLDHP EALTALREGW DTEQDLRVRC DLVRSLGGAD PAFDLTALLT HDDPQLCLAA 
AHALPATAAL PDATALANAV ASPDSAVWVD SAWLEDPRHD DALTELVITT GDLLAEDPAA 
LTGYVTLVAR NGIAPRRAAV LGSALRLLCT WRDVDLVPLL GTLLHDPHPA VRYRAAAVLA 
CLGPAARPHA DRLAALLQDR SEQPGESTTH TAGDMALWAL AAQGDPRCVP ALVALLESDR 
VPFDLNTHRP TNPTPVTACG PWLHEPTAEE VLTPLRAHAA ALVPPIAARL ARPDQHRLLV 
AALCRVLAAW GPLSGEAKSA LEPLTGHRYY GRYATAALKS IDGYTEADVP ALAGEARRSG 
VTIGVLGALG AAAAEAEDTL RRLATPDETA WRRVEASYAL WRVTGETTTA VPLLLEAAAP 
LATGDYTRPR GAALHHLAEI GVRTEEVLAT ARAVATTRRR VANVGDRERI AEDEALRASA 
AQLLG