Gene Sare_4211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4211
Symbol
ID	5707949
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4779702
End bp	4780640
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	67%
IMG OID	641273630
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001538983
Protein GI	159039730
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.736196
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00675709
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCGACG TGACGAGTGC CGGCACCGCC GTGGGCGGTA CGCCGGTCTC CGGCGGTGGC 
CGGGCCGGAA AGACGAGCAA GGGTGGCAAG GAGCGTAACG CCAGCCTCTG GGCCGACGCC 
CGCCGGCAGT TGGTCCGTGA CCCGGTCTTC ATGATCGCCC TGCTGTACGT TTTCGTGGTC 
AGCTCGATGG CGGCCTTCCC CACGCTCTGG ACCAGTCAGG ACCCGCGGGC CTGCAACACC 
GACTGGTCCC GGATCCCGCC GAGCGGGGAT CACCCGTTCG GCTTCGACCG CCTGGGCTGC 
GACTACTACT CGCACGCCAT CTATGGCGCC CAGCCGTCGA TGGTCATCGC GATCATGGCG 
ACCGGCGGCA TCGTGCTCTT CGGCGGCCTG ATGGGTCTGC TCGCCGGCTA CTACGGTGGC 
TGGATCGACG CGGTCATCTC CCGGTTGATG GACATCTTCT TCTCGCTGCC GTTCCTGCTT 
GGCGCGATCG TCTTCCTGAC CGTGATCAAG CGGCAGAACG TCTGGACCAT CGCCGCGGTG 
TTGTTCCTGC TGAGCTGGCC GACGATCGCC CGGATCATCC GCGGCAGCGT CATCTCCTCG 
AAGGACCTGG ACTACGTGCA GGCGGCCAAG GCGGTCGGGG CGAGCAACGG CCGGCTGATG 
TTCCGCCACA TCCTGCCGAA CGCGATCGCG CCGATGCTGG TGTACGCCAC CATCGTGCTG 
GGCGCCTTCG TCGCCGCAGA GGCCACGCTG ACCTTCCTCG GCATCGGGCT CCAGCCACCG 
ACGCAGTCCT GGGGAATCAT GATCTCGGCT CACCAGGTCT ACTTCCTGGA GGATCCGTGG 
CTGCTGCTCT TCCCCTGCGG GCTACTGATC GGCACGGTGC TGTCCTTCAT CCTCATGGGT 
GACGCCCTGC GTGACGCCCT CGACCCGAAG TTCCGGTGA

Protein sequence

MSDVTSAGTA VGGTPVSGGG RAGKTSKGGK ERNASLWADA RRQLVRDPVF MIALLYVFVV 
SSMAAFPTLW TSQDPRACNT DWSRIPPSGD HPFGFDRLGC DYYSHAIYGA QPSMVIAIMA 
TGGIVLFGGL MGLLAGYYGG WIDAVISRLM DIFFSLPFLL GAIVFLTVIK RQNVWTIAAV 
LFLLSWPTIA RIIRGSVISS KDLDYVQAAK AVGASNGRLM FRHILPNAIA PMLVYATIVL 
GAFVAAEATL TFLGIGLQPP TQSWGIMISA HQVYFLEDPW LLLFPCGLLI GTVLSFILMG 
DALRDALDPK FR