Gene Amir_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_1040
Symbol
ID	8325212
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	1154158
End bp	1155252
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	77%
IMG OID	644941584
Product	Monosaccharide-transporting ATPase
Protein accession	YP_003098842
Protein GI	256375182
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAAGGC TCGGGAGGGC GCTCTGCGCC GGGCTGCCCG CGCTGCTGCT CGCGGCCTGC 
GGCGGCGCCG CCGGACCGCC GGAGCGCCCC ACCAGGCCGC TCGTCGGCGT GATCCTGCCC 
GACACCGAGT CCTCCGCCCG CTGGGAGGAG CAGGACCGGC CGCAGCTCCA GCGCGCCCTG 
GAGGCCGAGG GGCTCGAACC GGTCGTCGAG AACGCCCGCA ACGACGAGTT CCGGTTCGCC 
AGCATCGCCG ACGACCTGAT CGCCAGGGGC GTGGCGGTCC TGCTGATCAC CCCGCTGACC 
CCCGAGGGCG GGGCCACCGT CGAGCACAAG GCGCGCAAGG CAGGCATCCC CGTCATCGAC 
TACGACCGGT TCAGCGTCGG CGGGGCCGCC GACTACCTCG TGTCCTTCGA CAACGAGGCC 
GTCGGCGAGC TCCAGGCGCG CGGGCTCGTG GACTGCATGG GGGACCGGCG GGGCGCGCGG 
GTGATCGAGC TGCAGGGCGC GCCGCAGGAC AACAACGCCA TGCAGTTCGC CGACGGGCAG 
CGCCGCGTCC TCGGCCCCCG CTACGAGCGC GGCGACTACC GGCTCGTGGC CAGCACGAGC 
GCCGACCGCT GGGACCCGCT GCTCGGGCGG GCCCGGTTCG AGCAGGCGCT CAACGACAGC 
GGCGGGCGCG TCGACGGGGT CCTCGCGGCC AACGACCGGC TCGCCGCCGC CGCCATCCAG 
GTGCTGCGCG CCAGGGGGCT GGCCGGGAAG GTGCCGGTGA CCGGGCAGGA CGCCACGGTG 
GACGGGCTGC GCGCGGTGCT GCGCGGCGAG CAGTGCCTGA CGGTGCACAA GTCCATCCGG 
GACGAGGCGG AGGCGGCGGC CCGGCTCGCC TCGGCGCTGG CGGACGGGGA CGTGGCGCGC 
GCGGACGCGC TGGCGAGCGC GACCACCGAG GACCCGACGA ACGGGCGCCG GGTGAGGGCG 
GTGCTGCTGG GGGCGGTCCC GGTGCACCGG GACGGCGTGC GGGTGCTGGT GGCGTCGGGG 
GTGGTGCGCG CCGAGGAGCT GTGCGTGCCG GACCTGGAGC GGACCTGCGC CGAGCTGGGC 
ATCGCGCCGA GGTGA

Protein sequence

MRRLGRALCA GLPALLLAAC GGAAGPPERP TRPLVGVILP DTESSARWEE QDRPQLQRAL 
EAEGLEPVVE NARNDEFRFA SIADDLIARG VAVLLITPLT PEGGATVEHK ARKAGIPVID 
YDRFSVGGAA DYLVSFDNEA VGELQARGLV DCMGDRRGAR VIELQGAPQD NNAMQFADGQ 
RRVLGPRYER GDYRLVASTS ADRWDPLLGR ARFEQALNDS GGRVDGVLAA NDRLAAAAIQ 
VLRARGLAGK VPVTGQDATV DGLRAVLRGE QCLTVHKSIR DEAEAAARLA SALADGDVAR 
ADALASATTE DPTNGRRVRA VLLGAVPVHR DGVRVLVASG VVRAEELCVP DLERTCAELG 
IAPR