Gene Sare_4780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4780
Symbol
ID	5704447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5411156
End bp	5412058
Gene Length	903 bp
Protein Length	300 aa
Translation table	11
GC content	68%
IMG OID	641274178
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001539524
Protein GI	159040271
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.684387
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000235996
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGCACGC TGTCCGAGGC GGTCGGCCCG GCCGAGCCGA AGGACGCGCC ACCGCGCGGC 
CTGTGGCGGC AGGGGCTGAT CGTCTTCTGC GAGAACCGGC TTGCCCTGGT GGGGCTGTGT 
CTGTTCGTCC TCCTGGCCGG GGTCTGTTTC CTCGGACCGT TGGTGTACCA GACCGACCAG 
GTACACACGG ACCTCACCGC CGTACACCTG GCCCCGGGAG AGCAGGGACA TCCACTCGGC 
ACCGACGGGG TCGGCTACGA CCAGTTGGGG CGGTTGATGC TCGGCGGCCA GACCTCCATC 
ATCGTCGGAC TGGCTGCCGG GATCCTCGCC ACCATCGTTG GCACGCTTCT GGGCGCCATC 
GCCGGCTTCG TCGGCGGCTG GGTGGACGCC GCGGTGATGC GCGTCGTCGA CGCGATGATG 
TCGATCCCGT CGTTGTTCCT GTTCATGCTG CTCGCCGCCA TCGTCACACC GAGCGTGCCG 
ATGCTCATCC TCATCATCGG CGCCTTCGCC TGGTTGGGTC CGGCCCGGCT CGTGCGAGGC 
GAGGCACTGA CGCTGCGCTC ACGCGAGTAC GTCCAGGCGA TGCGCGGGAT GGGTGGCACG 
GGCGGTCGTG CGGTCCGTCG ACACATCATC CCCAACGCCA TCGGCACGGT GATCGTCAAC 
GCCACCTTCC AGGTCGCCGA CGCCATCCTC TACGTCGCCT ACCTGTCCTT CCTCGGCCTC 
GGCGTCCCCC CACCGGCGGC GAACTGGGGT GGCATGCTCT CCGATGGTCT GGCGGACACC 
TACAGCGGCC ACTGGTGGCT GTTGTACCCG CCCGGGATCG CCATCATCCT CATCGTCCTC 
GCCTTCAACT TCATCGGTGA CGGGCTGAGG GATGCCTTCG AGGTTCGCCT CCGGCGACGC 
TAG

Protein sequence

MSTLSEAVGP AEPKDAPPRG LWRQGLIVFC ENRLALVGLC LFVLLAGVCF LGPLVYQTDQ 
VHTDLTAVHL APGEQGHPLG TDGVGYDQLG RLMLGGQTSI IVGLAAGILA TIVGTLLGAI 
AGFVGGWVDA AVMRVVDAMM SIPSLFLFML LAAIVTPSVP MLILIIGAFA WLGPARLVRG 
EALTLRSREY VQAMRGMGGT GGRAVRRHII PNAIGTVIVN ATFQVADAIL YVAYLSFLGL 
GVPPPAANWG GMLSDGLADT YSGHWWLLYP PGIAIILIVL AFNFIGDGLR DAFEVRLRRR