Gene Amir_5003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_5003
Symbol
ID	8329201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	5961381
End bp	5962493
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	75%
IMG OID	644945440
Product	pyruvate dehydrogenase (acetyl-transferring) E1 component, alpha subunit
Protein accession	YP_003102672
Protein GI	256379012
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03181] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.25658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCACAG CCACACCGGA CCGGACCCTG CTCCCCACCG AGGAACCGCT GGCGCTGCTG 
CGTCCCGACG GGTCCGCGGT CGAGGGCTCA CCGCTTCGGA TGCCCGACGA CGAGGTGCTG 
CTGGAGCTGC ACCGCCGCAT GGTCGTCGGC CGCCGCTTCG ACACCCAGGC CACCGCGCTC 
ACCCGCCAGG GCCGCCTCGC CGTCTACCCG TCCTCGCGCG GCCAGGAGGC GTGCCAGGTC 
GGCGCGGTCC TGGCGATGCG CGAGCGCGAC TGGCTGTTCC CCACCTACCG CGACAGCGTC 
GCCCTGGTCA CCAGGGGTGT GCCCGCCGCG GGCGCGCTGA CCCTGCTGCG CGGCGACTGG 
CACCTCGGCT ACGACCCGCG CGAGCACCGC GTCGGACCGC AGTGCACGCC GCTGGCGACC 
AACACCCCGC ACGCCGTCGG CTTCGCGCAC GCCGCCCGCT ACAAGGGCGA GGACACCGCC 
GCGCTGGTGC TGCTCGGCGA CGGCGCGACC AGCGAGGGCG ACACGCACGA GGCGCTGAAC 
TTCGCCGGGG TGTGGAAGGC GCCGGTGGTG TTCCTGGTGC AGAACAACGG CTACGCGATC 
AGCGTGCCGC TGAGCAAGCA GACCGCCGCG CCCACGTTGG CGCACAAGGG GATCGGGTAC 
GGCATCCGGT CGGTCCTGGT GGACGGCAAC GACGCGGCGG CGGTCCACGC GGTGGTGTCG 
GAGGCGCTGG CGTCCGGTGA GCCGGTGCTC GTGGAAGCGC TTACCTACCG CATCGAGGCG 
CACACCAACG CCGACGACGC GTCCCGCTAC CGGGACTCCG CCGAGGTCGC GCACTGGCTG 
GCCCGCGACC CCGTCGACCG GCTCGCCTCG CACCTGGCCT CGCGCGGGCT GCTCGACCCG 
GCGCGCCGAG ACTCGGTGGA CGCCGAGGCG GAGGAGTTCG CGGCGGCGCT GCGGGCCGAG 
CTGAACGCGG ACGCGCGCGT GGACCCGGCG GACCTGTTCC GGCACGTGTA CGCCGAGCCG 
ACCGCGCAGC TGCGCGAGCA GGCCGCGATG CTGGCGCGCG AACTGGACGC CGAGCACTCG 
GGCGCCGACG ACCTGGACGG GGGACGGGCA TGA

Protein sequence

MATATPDRTL LPTEEPLALL RPDGSAVEGS PLRMPDDEVL LELHRRMVVG RRFDTQATAL 
TRQGRLAVYP SSRGQEACQV GAVLAMRERD WLFPTYRDSV ALVTRGVPAA GALTLLRGDW 
HLGYDPREHR VGPQCTPLAT NTPHAVGFAH AARYKGEDTA ALVLLGDGAT SEGDTHEALN 
FAGVWKAPVV FLVQNNGYAI SVPLSKQTAA PTLAHKGIGY GIRSVLVDGN DAAAVHAVVS 
EALASGEPVL VEALTYRIEA HTNADDASRY RDSAEVAHWL ARDPVDRLAS HLASRGLLDP 
ARRDSVDAEA EEFAAALRAE LNADARVDPA DLFRHVYAEP TAQLREQAAM LARELDAEHS 
GADDLDGGRA