Gene Sare_1731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1731
Symbol
ID	5703430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2003236
End bp	2004765
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	71%
IMG OID	641271234
Product	amino acid permease-associated region
Protein accession	YP_001536609
Protein GI	159037356
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.177585
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00117638
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCCTCGA CAGCAACTAT CGAACGACCG AGCAACGTCT CTGAGGCGCT GGCCCGCGGC 
CGGCTCGGCG TGCCATCGGT GGTCTTCTTC GTCCTCTCCG CGGCGGCGCC ACTGACCGTG 
GTGGCGGGTG TGGTGACCAC CGGCTACGGC GTCATCGGGG TGCTCGGCAT ACCGCTGGCC 
TTCCTCGCTG TCGCCGCCCT GCTCGCCCTC TTCTCGGTCG GCTACGTGGC GATGGCCCGC 
CGGCTGGCCA ACGCCGGCGC CTTCTACTCG TACGTCTCGC GGGGACTGGG TCGGCCGGCC 
GGGGTCGGCG CCGCCTGGGT GGCGCTGATC GCGTACAACG CGCTGCAGGT CGGGTTGTAC 
GGCGCCATCG GCGCCGCCGC CGAGCCCGTC CTGGACCGGT TGTTCGGCGT CAGCGTGCAG 
TGGTGGCTGG TGGCCCTCGG CGCCTGGGCG GTTGTCGCCG TGCTGGGCCT GCTCCGGGTC 
GACATCAACG GCCGGGTGCT CGCGGTGCTG TTGCTCGCCG AGATCGCGGT GATCCTGGTG 
TTCGACCTCG GTCAACTGGG CAACCCCGCC GGCGGCCAGG TCAGTTTCGC CGCGTTCGCA 
CCGGACAACC TCTTCGTCCC GGGCATCGGC GCGGTGCTGG TGCTGGCGAT CCTCGGGTTC 
GTCGGGTTCG AGTCGGCTGT GGTCTTCAGC GAGGAGAGCA AGGATCCCCG CCGCACGGTG 
CCGATGGCCA CCTACCTGTC CATCGCGATC ATCGCAGGGC TCTACGCGCT CTCGTCGTGG 
AGTATGACCG TCGCGGTCGG GCCGGACCAG ATCTCCGAAC AGGCCGGCGA GCAGAGCGTC 
GCGCTGATCT TCAACCTGGC CGGTGAGCAC CTCGGTGACA CCGTCGTGAC CATCGGCCAG 
GTGCTGTTCC TGACCTCGGT GGTAGCCGCC ATGATCTCCT TCCACAACAC CACCGCCCGG 
TACGCGTTCG CCCTCGGCCG GGAGCGGGTG CTGCCGGCGG CCTTCGGGCG GACCTCGCCC 
CGCAGCGGCG CCCCCCGCAC GGCGTCCCTC GCGCAGAGCA CGCTCGGCCT GGTGGTGATC 
CTGCTGTACG CGGTCAACGG GTGGGATCCG ATCGTGCAGC TCTTCTACTG GTGCGGCACC 
AGCGGTGGGT TCGGGGTGCT GCTGCTGATC GCCACCACGT CGGTCGCGGT GATCGCGTAC 
TTCGCTCGCA CCGGCGTGGC GGAGACGCTG TGGCGACGGG CGGTGGCACC AGGGCTCGCC 
ACGGTGGCGC TGCTGGGTGT GCTCACCCTA GCGTTGATCA ACTTTGCCGA CCTGCTCGGC 
GTGGCACCGG ACCACGCCCT GCGCTGGGGG GTCCCGGTCG CGTACCTGGC TGCCGCGCTG 
CTCGGTGTGG TGTGGGGGCT GGTGTTGCGG TCGAACCGTC CGAGTACCTA TGCCCGGATC 
GGGCTCGGCG CGGAGAGCGC CGCCGCCACG GTTCGGCCCG AGACACCGAC GCTGCCGGCG 
GTGCCGGATC GGACGGCGGC CCCGCGGTGA

Protein sequence

MSSTATIERP SNVSEALARG RLGVPSVVFF VLSAAAPLTV VAGVVTTGYG VIGVLGIPLA 
FLAVAALLAL FSVGYVAMAR RLANAGAFYS YVSRGLGRPA GVGAAWVALI AYNALQVGLY 
GAIGAAAEPV LDRLFGVSVQ WWLVALGAWA VVAVLGLLRV DINGRVLAVL LLAEIAVILV 
FDLGQLGNPA GGQVSFAAFA PDNLFVPGIG AVLVLAILGF VGFESAVVFS EESKDPRRTV 
PMATYLSIAI IAGLYALSSW SMTVAVGPDQ ISEQAGEQSV ALIFNLAGEH LGDTVVTIGQ 
VLFLTSVVAA MISFHNTTAR YAFALGRERV LPAAFGRTSP RSGAPRTASL AQSTLGLVVI 
LLYAVNGWDP IVQLFYWCGT SGGFGVLLLI ATTSVAVIAY FARTGVAETL WRRAVAPGLA 
TVALLGVLTL ALINFADLLG VAPDHALRWG VPVAYLAAAL LGVVWGLVLR SNRPSTYARI 
GLGAESAAAT VRPETPTLPA VPDRTAAPR