Gene Sare_3549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3549
Symbol
ID	5703930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4093755
End bp	4095320
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	73%
IMG OID	641272976
Product	leucyl aminopeptidase
Protein accession	YP_001538342
Protein GI	159039089
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.984624
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0353646
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACATCGT CCACCATCAC TCTCAGCCTC GTCGACACCG ACCCCGCCGA ACTCGCCGTC 
GACGCGATCG TCATCGGCGT GCACAGCCAG CCCGGTGAGC GGGCCGGCGA CCTCGTCGGC 
ACCCTGCTGC TGGCCAGCGG CGCGGAGAGC ATCGCCGCGG CGTTCGATGG AAAATTGACC 
GAAACGCTGG CGTTGCTCGG CGCAACCGGC GGACCGGGCG AGGTGATCAA GCTCGCCACG 
CTCGGCACGG TAACCGCTCC GGTGGTTGCT GCGGTGGGCC TCGGACCGGA GCCGACCGGC 
GCCGCCCCCG CCCCTGAGAT CCTGCGCCGT GCGGCCGGCG CGGCCGTGCG TGCGCTGGCC 
GGCACGGCCC GGGTCGCGCT GACCCTGCCG CTGCCGGACG ACGCCGACGC GCCGGCGGCG 
CTGCGCGCGG TCGCTGAGGG TGCGTTGCTG GGCGGGTACC GGTTCACCGG CTACAAGACC 
CGTCCGCAGC CGGCCCGGCG GGAGCCGGTC GCGGAGGTGC TGGTGGCGGT CCCGGACGCG 
GGTGACGCGG TCGCCACCGC TGAGGTCGCC CGGGCGCAGG CGGTGGCCAC CGCGGTCCGC 
CGCTCCCGGG ACTGGGTCAA CGCCGCCCCC AACGAGCTAC GCCCGCCGGC CTTCGCCGAC 
GCCGTGGCCG ACGCCGCCCG CGCAGCCGGG CTGGAGGTGG AGGTCCTCGA CGAGGTCGCC 
CTGCGCGAGG GTGGCTACGG CGGCATCACC GCCGTCGGGC AGGGGTCGGA GGCACCGCCA 
CGGCTGGTGC GAATCAGCTA CATCCCGGCT GGCGGGGGCA CCGGCAAGCG GGTCGCCCTG 
GTCGGCAAGG GCATCACCTT CGACACCGGC GGCGTCTCGA TCAAGCCGTC TCAGGGCATG 
TGGGAGATGA AGTCCGACAT GGCCGGCGCC GCCGCCGTCG CCGCCGCGAT GCTGGCGGTC 
GCGGAGCTTG CGCCCGCCGT GCCGGTGACC GCGTATGTGC CGATGGCGGA GAACATGCCC 
TCCGGCACCG CGTACCGGCC GGGCGACGTC ATCACGATGT TCGACGGTAA GCGTGTCGAG 
GTGCTCAACA CCGACGCCGA GGGGCGGATG ATCCTCGCCG ACGCGATCGC CCGCGCCTGC 
ACGGACGGCT GCGACTACCT GCTGGAGACC TCCACCCTGA CCGGCGGCCA GGTGGTCGCG 
CTGGGCAAGC GGGTGGCCGG TGTGATGGGC ACGCCGGAGT TGTGTGAGCG GGTACGGACT 
GCCGGCGAGG CGGTCGGCGA GCCGACCTGG CCGATGCCGC TGCCGGAGGA CGTGCGCAAG 
GGCATGGACT CCGAGGTCGC CGACATCTCC CAGGTCAACG CCGGGATGGA TCGAGCAGGT 
CACATGCTTC AGGGCGGCGT GTTCCTGCGC GAGTTCGTCG CTGACGAGGT GTCCTGGGCG 
CACATCGACA TCGCCGGGCC CAGCTACCAC TCCGGCGAGC CGACCGGCTA CCTGACCAAG 
GGCGGCACCG GCGTCCCCGT CCGCACCCTG CTGCACCTGA TCGAGGACAT CGCCACCCAG 
GGCTGA

Protein sequence

MTSSTITLSL VDTDPAELAV DAIVIGVHSQ PGERAGDLVG TLLLASGAES IAAAFDGKLT 
ETLALLGATG GPGEVIKLAT LGTVTAPVVA AVGLGPEPTG AAPAPEILRR AAGAAVRALA 
GTARVALTLP LPDDADAPAA LRAVAEGALL GGYRFTGYKT RPQPARREPV AEVLVAVPDA 
GDAVATAEVA RAQAVATAVR RSRDWVNAAP NELRPPAFAD AVADAARAAG LEVEVLDEVA 
LREGGYGGIT AVGQGSEAPP RLVRISYIPA GGGTGKRVAL VGKGITFDTG GVSIKPSQGM 
WEMKSDMAGA AAVAAAMLAV AELAPAVPVT AYVPMAENMP SGTAYRPGDV ITMFDGKRVE 
VLNTDAEGRM ILADAIARAC TDGCDYLLET STLTGGQVVA LGKRVAGVMG TPELCERVRT 
AGEAVGEPTW PMPLPEDVRK GMDSEVADIS QVNAGMDRAG HMLQGGVFLR EFVADEVSWA 
HIDIAGPSYH SGEPTGYLTK GGTGVPVRTL LHLIEDIATQ G