Gene Amir_1954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_1954
Symbol
ID	8326139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	2162777
End bp	2164489
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	73%
IMG OID	644942503
Product	LPXTG-motif cell wall anchor domain protein
Protein accession	YP_003099748
Protein GI	256376088
COG category	[R] General function prediction only
COG ID	[COG3889] Predicted solute binding protein
TIGRFAM ID	[TIGR01167] LPXTG-motif cell wall anchor domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.614483
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCGCACT ATCGGTTCAT GCGTTTGAGT CGACTCTCGG TAGTTGCGGG TATTGCCACC 
GGTCTGGTTG TCACGACGGC CACCGTCGTC CTGGCCAGCG CCCAGGCCAG CCCCTCCCCC 
GCCACGGGCC CCGGCCCGTG CGTCGGCGCC GAGTGCCCGG CCGAGTACGC GCCGGTCCGC 
GGCAACAGCG GGCGGTTCGA CGGGCGCGAC GAGGCGGTCA ACGTGTTCGT CGGCAAGTCG 
TTCACCGTGT CCGGCAACGC GGCCGAGGCC GAGGGCAGGC TCGTCGTCGG GGGCTCGTTC 
ACCCTGGCGA AGGACGGCAG CGGCGTCGGC TACAACGTCG GGACCGTGGG CGCGGGCTCG 
CAGGTGCCGC CGCCCGCGGG CTCGGACTTC CTGGTCACCG GCGGGGACCT GACCATCGCG 
CCGGGCCAGG AGCTGCGCGC CGACGGCGGT GTCGTGCGGT ACGCGGGCAC CAAGACCGGC 
GTGGTCAGCA GCACCGGCGC CGCCGTGCAG GACGACAACG CCTTCGCGCC CTACGCGGGC 
ATCGGCGAGG CGCTCCGCGA GGACAGCGCC TGCTACGCCG CGCTCCCCGC CACCGGGACG 
GTCACCCGCG ACGACCTCGC CACCACGTTC ACCGGCGACG GCGTGTCCGC GCTCCAGGTC 
TTCACCCTGG CGGGCGACAT CACCGGGGCG AACGGGTCGA TGCAGGGCAT CGAGTTCGTG 
GGCGTCCCGG ACGGCGCGAC CGTGCTGGTC AACGCCACCG GTTCCGCGCC CCGCATCACC 
AGCTGGTCCG GCACGCACAA CAACCGCGAC GGCATCGACC GCCTCGGGCA GCGGCTGCTG 
TGGAACTTCC CGAACGCCAC GACCGTGACC CTGAACGGCC AGTCCGAGTT CCAGGGCAGC 
GTGGTCATCC CCCGCCAGGA CAGCACCGCG AAGGTCAGCA CCCCCGGCTT CAGCGGGCGG 
TTCTTCACGG CGGGCTCGCT GGAGCACGGC GGCAACGGCA GCGGCGACGG CAACGAGTTC 
CACGCGTACC CGTTCACCGG CGTGATCCCG ACCTGCGGCA CCGGCACCAC GACGGTCCCG 
AGCAGCAGCA CGACCAGCAG CACCAGCACG ACGACGGTCG AGACCACGAC GTCGAGCAGC 
ACCACGACCA CCGCGCCCAG CACCACGACG ACCGCGCCGA CGACCACCAC CGCGCCGAGC 
ACCAGCACCA CCACGAGCAC GACCGTCGAG ACCACGACCA CGACGCCGTG CGAGGAGACC 
ACCCCGGAGA CCAGCACCAC CACCACGGTC CCGACCACGA CGACCGCGCC GAGCACCAGC 
ACGACGACCA GCACCACGAC GGTCGAGACC ACCCCGGAGT CGAGCACCCC GGAGACCAGC 
ACCAGCAGCA GCTCCACCAC GACCACCGCG CCGTCGACCA CGTCCTCGTC CTCCTCGGCG 
ACGACCTCGT CGACCACCTC CGCGACGACC TCGTCGTCGT CGACGTCCGA GACCACCTCG 
GCGACGACGT CGACCAGCAC TGAGGCGTCG AGCACCACCG CCACGAGCCC GAGCACCTCG 
GAGAACCCGG TCGTCCCGGC CGTCGCGAAG ACCTCGGGCG GCGCGGGCCT GGCCCACACC 
GGCTCCCCCG CCGGGATGGC GCTGGCCATC GGCGCGCTCC TGCTGATCGG CGGCGCGGCG 
CTGTTCGCGG TGACCCGCCG CCGCAAGGTC TGA

Protein sequence

MPHYRFMRLS RLSVVAGIAT GLVVTTATVV LASAQASPSP ATGPGPCVGA ECPAEYAPVR 
GNSGRFDGRD EAVNVFVGKS FTVSGNAAEA EGRLVVGGSF TLAKDGSGVG YNVGTVGAGS 
QVPPPAGSDF LVTGGDLTIA PGQELRADGG VVRYAGTKTG VVSSTGAAVQ DDNAFAPYAG 
IGEALREDSA CYAALPATGT VTRDDLATTF TGDGVSALQV FTLAGDITGA NGSMQGIEFV 
GVPDGATVLV NATGSAPRIT SWSGTHNNRD GIDRLGQRLL WNFPNATTVT LNGQSEFQGS 
VVIPRQDSTA KVSTPGFSGR FFTAGSLEHG GNGSGDGNEF HAYPFTGVIP TCGTGTTTVP 
SSSTTSSTST TTVETTTSSS TTTTAPSTTT TAPTTTTAPS TSTTTSTTVE TTTTTPCEET 
TPETSTTTTV PTTTTAPSTS TTTSTTTVET TPESSTPETS TSSSSTTTTA PSTTSSSSSA 
TTSSTTSATT SSSSTSETTS ATTSTSTEAS STTATSPSTS ENPVVPAVAK TSGGAGLAHT 
GSPAGMALAI GALLLIGGAA LFAVTRRRKV