Gene Sare_4779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4779
Symbol
ID	5704446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5410200
End bp	5411159
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	66%
IMG OID	641274177
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001539523
Protein GI	159040270
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000244558
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGGCCCGGT ACCTCATCAC GCGCCTGGGA CAGGCACTCA TCGTCGTCGT ACTCGTCACG 
GTGATCGCGT TCCTCATCCT GCACCTGCTG CCCGGGGGCG CCGCACGAGC CACCCTCGGC 
AAGGAGGCGA CGCTGGAGCA GTTGGCGGCG TTCAACCACG AGATGGGCTA CGACCGGCCG 
TTGATCCAGC AGTACGGCAT GTACGTACAG CGCCTGCTGC AGGGTGATCT CGGCTACTCG 
TACCAGCTCA ACCAGTCCGT TCTCGAGGCG ATCGAACAGC GGCTACCCAA GACGATGGTG 
TTGTCGCTGC TGTCGACCCT GCTCGCCGTC GTGTTGGCGA TCCCGCTCGG CGTGCTCCAG 
GCGGTACGCC GCAACCGATG GCCCGACTAC GCCATCACCG CGCTGTCGCT GCTGGCGTAC 
GCCACGCCCA TCTTCTTTCT GGGCCTCATG ATGATCATTG TCTTCTCGCA GGTCTGGCCG 
ATCCTGCCCC CGGAGGCACC GCAGGGGTTC ACGGTGGCCG AGGTGCTCGC CGATCCGGCC 
GGGCTGGTCC TACCCACGGC CACCCTCGCC ATCGTCACCA TCGCGGTCTA CGCGCGGTAC 
GTGCGGTCAT CCATGATCGA CAATCTGAAC GAGAACTACG TGCGGACCGC CCGCAGCAAG 
GGGCTCTCCG AGCGGCGGGT TGTGCTGCGA CACACCCTGC GTAACGGGCT GTTCCCGGTC 
ATCACGCTGC TCGGGATGTA CCTGCCCGCG CTGTTCAGTG GAGCGCTGGT CGTCGAGTCG 
CTGTTCAATT TCCCCGGGAT GGGCCAGCTG TTCTGGCAGG CGGCCCTCAA GCGGGACTTT 
CCGATCCTGC TCGGGGTCAC CGTCATCATC TCGATCGCCA CGGTCGTCGG CGCGCTGATA 
GCCGACCTGC TCTACGCCAC CGTCGACCCC CGAGTCCGAC TCCGTGGGAG TGCCACATGA

Protein sequence

MARYLITRLG QALIVVVLVT VIAFLILHLL PGGAARATLG KEATLEQLAA FNHEMGYDRP 
LIQQYGMYVQ RLLQGDLGYS YQLNQSVLEA IEQRLPKTMV LSLLSTLLAV VLAIPLGVLQ 
AVRRNRWPDY AITALSLLAY ATPIFFLGLM MIIVFSQVWP ILPPEAPQGF TVAEVLADPA 
GLVLPTATLA IVTIAVYARY VRSSMIDNLN ENYVRTARSK GLSERRVVLR HTLRNGLFPV 
ITLLGMYLPA LFSGALVVES LFNFPGMGQL FWQAALKRDF PILLGVTVII SIATVVGALI 
ADLLYATVDP RVRLRGSAT