Gene Amir_3958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_3958
Symbol
ID	8328151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	4640945
End bp	4642042
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	68%
IMG OID	644944434
Product	Pectate lyase/Amb allergen
Protein accession	YP_003101671
Protein GI	256378011
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3866] Pectate lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGAT CAGTCGTCCG GCGAATCCCC GCGGTCGTGG CCGCGCTGCT CGTCTCGACC 
ACCGCGGGCG CCGCCCTCAC CGCCGGGTCG GCCTCCGCCG CGGGCGCCGC GACCGGGTAC 
GCCTCCGCCA ACGGCGGCAC CACCGGCGGC CAGGGCGGGG CGACGGTCCG GGCCACCACG 
GGCACCCAGA TCCACCAGGC GCTGTGCGGC CGGGCCGGCA CGAGCACCCC CATCACCATC 
GAGGTGCAGG GGACCATCAA CCACGGCAAC ACCAGCAAGG TCTCCGGAAG CTGCGACACC 
GCCGCCGGGG TCATCGAGCT CAAGAAGATC AGCAACGTCA CGATCATCGG CGTCGGCTCC 
GGCGCGGTGT TCGACCAGAT CGGCATCCAC ATCCGCGAAT CCCGCAACAT CATCATCCGG 
AACGTGACGA TCCAGAACGT CAAGAAGTCC GGATCGCCCA CGTCCAACGG CGGCGACGCC 
ATCGGCATGG AGCGGGACGT GCGCAACGTG TGGGTCGACC ACGTCAACCT GATCGCCTCG 
GGCGGCGAGT CGGCGGGGTA CGACGGGCTT TTCGACATGA AGGACAACAC CCAGTATGTG 
ACCCTGTCCT ACAGCACCCT GCGCAATTCC GGTCGCGGCG GTCTGGTCGG TTCCAGCGAG 
AGCGACCGCT CGAACAGCTT CATCACCTAC CACCACAACC TGTACCAGAA CATCGACTCC 
CGGACCCCGC TGCTGCGCGG CGGCACGGCG CACATGTACA ACAACAACTA CGTGAGCCTG 
AACGAGTCCG GCATCAACTC GCGCGCGGGC GCGAAGGCCA AGGTCGAGAA CAACTACTTC 
AAGAACTCCC GCGACGCCCT CGGCACCTTC TACACCGACG AGGCGGGCTA CTGGCAGGTC 
AGCGGGAACA CGTTCGACAA CGTCACCTGG TCCACCCCGG ACGACGAGAC CAACCCGGCG 
GGGCCGAACC CGCAGTCCAC CACCTCGGTC ACCGTGCCCT ACAGCTACCG GCTCGACCAG 
ACGAGCTGCG TGCCGACCAT CGTCGCCCGC ACGGCGGGGG CCAACACGGG CCTGAAGGAG 
TCGGACGGCT CCTGCTGA

Protein sequence

MKRSVVRRIP AVVAALLVST TAGAALTAGS ASAAGAATGY ASANGGTTGG QGGATVRATT 
GTQIHQALCG RAGTSTPITI EVQGTINHGN TSKVSGSCDT AAGVIELKKI SNVTIIGVGS 
GAVFDQIGIH IRESRNIIIR NVTIQNVKKS GSPTSNGGDA IGMERDVRNV WVDHVNLIAS 
GGESAGYDGL FDMKDNTQYV TLSYSTLRNS GRGGLVGSSE SDRSNSFITY HHNLYQNIDS 
RTPLLRGGTA HMYNNNYVSL NESGINSRAG AKAKVENNYF KNSRDALGTF YTDEAGYWQV 
SGNTFDNVTW STPDDETNPA GPNPQSTTSV TVPYSYRLDQ TSCVPTIVAR TAGANTGLKE 
SDGSC