Gene Sare_1963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1963
Symbol
ID	5705210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2258281
End bp	2259687
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	65%
IMG OID	641271468
Product	amino acid permease-associated region
Protein accession	YP_001536839
Protein GI	159037586
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.281005
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTTC ATGGTGACCT TGCTAAATAC GGCTATCGCC AGGAGTTGAG TCGACAACTC 
CGGTTCCGGG ACCTGCTGGC GTATGGGCTG GTGTATATGG TGCCGATCGC GCCGATGGCG 
ATTTTCGGTA GTGTGTATGC CGGTTCTGGT GGCATGGTGG CACTTGCCTA TGTGATCGGT 
GTGGTCGCGT TGGTGTTCAC TGCGTTTTCG TATGCGCAGA TGGTACGGGC GTTCCCGATG 
TCGGGCAGCG TTTACAACTA TGCGGGTCGG GGTATCAGCC CTCCAGTCGG TTTCCTCGCC 
GGGTGGGTGA TCCTGCTGGA CTATGTGCTC GTGCCGGGCC TGCTGTATTT GGTGGCGTCG 
GTGGCGATGC ACGCGACCGT GCCAGTAGTG CCGGTGTGGT TGTGGCTGAT CGGGTTCGTC 
GCGGTCAACA CGATCGTCAA CTCGGTCGGC ATCCGGATGA CCGCGATGGT GACCCGGGTG 
ATGCTCGTCG GCGAGCTGAT CGTCCTGGCG ATCTTCCTCG CTGTCGCCGG CTGGGCCCTC 
GCCTCGGGCA GGGGGCGGTT TAGTTGGGAG GCCTTCTACA ACGCCAACAC GTTCACCTGG 
TCGCTTGTTG CCGGCGCCGT GTCGATCGCG GTGCTGTCCT TCCTCGGCTT CGATGGCATC 
TCGATGCTGG CGGAGGAGGC CAAGGGCGGC TCTCGGCAGA TCGGTCGGGC GATGGCCGCT 
GTGCTGGTCC TGGCTGGCGT GTTGTTCATC GCGCAGACGT GGCTGGCCGC GATGCTCGTT 
GCCGAGCCGG CCTCCCTGCG CGGTGATGGG GATCCGGACG GCACGGCCTT CTACGAGGCG 
GCTGCGGTGG CCGGTGGGGG CTGGCTGGCG ACCTTGTGCG CGGTCGCGAC CGCGATCGCA 
TGGGGATTGC CGAATTCGAT GGTGGCGCAG GTGGCCACAT CGCGGCTGTT GTATGCGATG 
GCCCGGGACC GGCAGTTGCC CGCCTTTTTG GCGAAGGTGT CGGTACGCCG CAGCGTGCCG 
ATCAACGCGA CCCTGCTCAC CGGTGCCGTG TCTCTGGTGT TGGGCCTGTC CATGGCGGCC 
CGGGCGGACG GGATCACACT GCTGTCGTCG CTGATCAACT TCGGGGCGAT GGTGGCGTTC 
CTGGTCCTGC ACGTCAGCGT GATCGTGCAC CACCTCATCC GCCGGCGCAG CCGCAACTGG 
TGGGCGCATC TGGTCATGCC CGCTGTCGGA TTCGCGATTC TCTCCTACGT CGTGGTCAAC 
GCCGATATCG CCGCGCAGCG CCTCGGTCTG ACCTGGCTCG CCCTTGGGGT CCTTGTCCTC 
GCCGGCCTGT ACCTGTCCGG TCGCCGGCCG GCCCTGTCGG GCCTGGCGCC CGCGCAGACA 
CACGATCATG AGATGGAGCG AGTGTGA

Protein sequence

MSLHGDLAKY GYRQELSRQL RFRDLLAYGL VYMVPIAPMA IFGSVYAGSG GMVALAYVIG 
VVALVFTAFS YAQMVRAFPM SGSVYNYAGR GISPPVGFLA GWVILLDYVL VPGLLYLVAS 
VAMHATVPVV PVWLWLIGFV AVNTIVNSVG IRMTAMVTRV MLVGELIVLA IFLAVAGWAL 
ASGRGRFSWE AFYNANTFTW SLVAGAVSIA VLSFLGFDGI SMLAEEAKGG SRQIGRAMAA 
VLVLAGVLFI AQTWLAAMLV AEPASLRGDG DPDGTAFYEA AAVAGGGWLA TLCAVATAIA 
WGLPNSMVAQ VATSRLLYAM ARDRQLPAFL AKVSVRRSVP INATLLTGAV SLVLGLSMAA 
RADGITLLSS LINFGAMVAF LVLHVSVIVH HLIRRRSRNW WAHLVMPAVG FAILSYVVVN 
ADIAAQRLGL TWLALGVLVL AGLYLSGRRP ALSGLAPAQT HDHEMERV