Gene Sare_0644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0644
Symbol
ID	5707843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	725113
End bp	726132
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	69%
IMG OID	641270164
Product	TrkA domain-containing protein
Protein accession	YP_001535557
Protein GI	159036304
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0569] K+ transport systems, NAD-binding component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.247838
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00992918
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGATCCATT TCCCGGCGCA ACGGCGCGAT CCGCTGAGCG CCCTGAGTCT GCGGCTGGCC 
GCGGCCCTCG GGCTTGTCCT CGCCAGCGTC GCTGTGGTGT GGCTGGACCG GGACGGTTAC 
CGAGACGCCA ACCGCGACGC CCCCGGGCTG AGCCTCCTCG ACTGCTTCTA CTACGTGGTG 
GTCTCCCTCT CCACCACGGG GTACGGCGAC ATCACCCCGG TCACCGAGTC GGCCCGCCTG 
CTCAATGTCC TCTACATCAC GCCGGCCCGG GTGATCTTCC TGATCATCCT GGTCGGCACC 
ACCCTGGAAG TCCTGACCGA GCAGTACCGG ACCGGCCTTC GCCTGTCGCG GTGGAGGAGA 
GCTGTGAAGG ACCACGTCAT CATCTGTGGC TACGGCACAA AGGGCCGTAG CGCGATCTCC 
GCCCTGCTCG AGAACGGTTT CGACAAGTCC AGGATCGTGG TGGTCGAGCG CAGCGGCGCC 
GCCCTGCGGC AGGCCACCTC GGCCGGACTG GTGGCCATCG AGGGGTCGGC GACTCGCTCG 
GCCACCCTCA ACGAGGCGCA CATCCGGACC GCCAAGGCGG TGATCATCGC AACCGACAGT 
GACGATGCCT CAGTGCTGGT GGCACTGACC GTCCGGCAGC TCACCGCGGG ACAGGTGCGG 
ATCATCGCCG CCGCCCGGGA GGCGGAGAAC GCCCCGCTGC TCAAGCAGAG TGGTGCCCAC 
CACGTCATCG TCTCTTCGGC GACGGCCGGC CGGTTGCTGG GTCTCTCCAC CTCCGCGCCG 
CCGCTGATCG AGGTGGTGGA GGACCTGCTC ACGCCTGGTC AGGGCATGGC ACTCGCGATG 
CGTTCGGCCG AGCGGCACGA GGTCGGCCGC TCCCCCCGCG AGCTGGACAC CCTGGTGATC 
GCGTTGGTGC GGCGGGGCAA GGTGGTCACC CTCGCCGACC GGGCCGGCGG GGTCATCGAA 
ACCGGCGACA TGCTGGTCCA CGTCCGGGAC GACCGCCGGA CCTCCTCGCC GGTGTCCTGA

Protein sequence

MIHFPAQRRD PLSALSLRLA AALGLVLASV AVVWLDRDGY RDANRDAPGL SLLDCFYYVV 
VSLSTTGYGD ITPVTESARL LNVLYITPAR VIFLIILVGT TLEVLTEQYR TGLRLSRWRR 
AVKDHVIICG YGTKGRSAIS ALLENGFDKS RIVVVERSGA ALRQATSAGL VAIEGSATRS 
ATLNEAHIRT AKAVIIATDS DDASVLVALT VRQLTAGQVR IIAAAREAEN APLLKQSGAH 
HVIVSSATAG RLLGLSTSAP PLIEVVEDLL TPGQGMALAM RSAERHEVGR SPRELDTLVI 
ALVRRGKVVT LADRAGGVIE TGDMLVHVRD DRRTSSPVS