Gene Sare_4267 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4267
Symbol
ID	5705772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4843103
End bp	4844281
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	68%
IMG OID	641273686
Product	extracellular ligand-binding receptor
Protein accession	YP_001539039
Protein GI	159039786
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.033061
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCCCCA TCCGCTCCGC AACCGCGGCG CTCACCTCGG CCGTCCTGGC CACCACGCTC 
ACCGCCTGCC AGTTCGGCGC GGAGGAGCAA GACACCAGCC CCATCATCGT CGCCGCCGAC 
CTCGAACTGT CCGGGGCCGG GGCACCGGTG GGCGAAACGT ACCAGCGCGC CCTCGAGCTC 
AAGGCCCAAC AGCTCAACTC GTCCGGCGCC CTGAACGGAC GGCGGATCGA GCTGCGAGTC 
AGGGACAACC GTTCCGACGC GAGCGAATCC CTTCGCAACG TCAATGACTT CGGTGCGGAC 
GCACAGGTCA GCGCGATCAT CATGGGCGGT TGCAACGAAT GCGCGGTGGG CGCGGTAGGC 
ACTATCGACG ATCAGCGCGT GCCCATGGTC GCGCTGGCTC CCGCCGACGC CATCGCCAGC 
CCGGCGATGG AGCGTCGATA CGTGTTCAAA CTGGCCCCGA ACGCGCCCGA CAGCGCGGAG 
GCCCTCGCGA TCGAGCTTCG TCGCAACCAG ATCCGCGAGG TGGGTGTGCT GCGCAGCGAA 
GACGACTTCG GCCTGGAGGG GCTCACCGCA CTCCAGGCCG CGCTGGAGAA GGCGGATATC 
GAGGTCCTGA GTGTGGGAAC CGTCCGCGCC ACCGACACCG ACGTCTCCAA CCAGGTCACG 
TCGCTGATCA AGGACAGGCC GGACGCGCTG GTGCTGTGGA CCCGCGCGGA GCAGGCCGGC 
CTCGCGGCGC TGGCGGCGCG CAAGGCCGAC TTCGACGGCT CGCTCTACTT CGACGCCTCG 
GCGGCCGGAA ATCTCTTCCT CGGCACGACC GCCCAGGCCT CGGAGAACGC CACCATGGTC 
TTCACCCAGA CCATGGTGAT TGATGACGTG ATCGCCACGA CGCCAGCGAA GGCGGCACGG 
CGTCAGTGGT TTCAGGACTA CACCGCACGC TTCGGCGGAT ACCACGGCTC GTCCTCGTTC 
GCCGCCGATG CCCTCCAACT CATCGCCGAC GCTGTCCTGC GGTCGGAGGG TGAGCCCGGC 
AAACCCAACC GTGAGGGCAT CCGCAACGTG CTGGAAACCT CTCAGCTGGA CGGACTCTCC 
GGCCCGATCC GACTCACTCC GGACAACCAC TCCGGTCTCA TGCCACAGGC GTTGACCACA 
CTGGTCGCCC GCAACGGCCG TTGGCGCCTC GCCGGGTGA

Protein sequence

MSPIRSATAA LTSAVLATTL TACQFGAEEQ DTSPIIVAAD LELSGAGAPV GETYQRALEL 
KAQQLNSSGA LNGRRIELRV RDNRSDASES LRNVNDFGAD AQVSAIIMGG CNECAVGAVG 
TIDDQRVPMV ALAPADAIAS PAMERRYVFK LAPNAPDSAE ALAIELRRNQ IREVGVLRSE 
DDFGLEGLTA LQAALEKADI EVLSVGTVRA TDTDVSNQVT SLIKDRPDAL VLWTRAEQAG 
LAALAARKAD FDGSLYFDAS AAGNLFLGTT AQASENATMV FTQTMVIDDV IATTPAKAAR 
RQWFQDYTAR FGGYHGSSSF AADALQLIAD AVLRSEGEPG KPNREGIRNV LETSQLDGLS 
GPIRLTPDNH SGLMPQALTT LVARNGRWRL AG