Gene Sare_3968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3968
Symbol
ID	5705245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4506426
End bp	4507478
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	65%
IMG OID	641273393
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001538749
Protein GI	159039496
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1175] ABC-type sugar transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.252536
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.145093
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTTCG ACTTCGCCGA CGAGGCGCCG AAACTCGCCA TGCTGTTGTA CGGGGTGGTC 
GCCTTCGTGG CGGTGGTGGG TGGACTCCTG CTACTGCTCG ACGCCGTCCC CGCGCGGCTC 
GCCCGCCGTC GGGAGGCCCG GCTCGCCGCG GCCGTCGCCG CCGGGAAAGT GATCGAACCG 
GGCCGACGCC GGCCCCGCGA CGGACTGTTC GCTCTCTTCT TCCTGCTGCC CGCTGTCCTG 
ATGCTCGGCA TCGGACTCGT CGTTCCCGCG ATCCGTACCC TCGTGCTGTC GTTCAAGAAC 
GGCGACAGCA CGGAGTGGGT CGGCCTGCGC AACTACGGCT GGATGTTCGA CCGACCCGAG 
ATCGTCGACA TCCTGGTGAA CACCGCCCTT TGGGTGTTGC TGGTGCCGCT GCTGGCCACC 
TGCATCGGTC TGATCTACGC GGTGCTCATC GACCGGGCCC GCCTGGAGGC ACTGGCCAAG 
TCTCTGATCT TCCTCCCGAT GGCAATCTCG TTCGTCGGCG CCGGAATCAT CTGGAAGTTC 
GTCTACGCGT TCCGGCCCGC GGAGGCAGAC CAGATCGGCC TACTCAACCA GGTCTGGGTG 
TGGCTCGGTG GCGAGCCGCA GCAGTGGCTG ACGAATCCTC CACTGAACAC CCTGCTGCTG 
ATCGTGGTGA TGATCTGGAT CCAGGCCGGC TTCGCCATGG TGGTGCTCTC GGCCGCCATC 
AAGGCCATTC CCACCGACAT GATCGAGGCC GCCCGAATCG ACGGCGTGAA CGCCTGGCAG 
CTGTTCTGGC GGATCACCGT GCCCGGCATC CGGCCCGCAC TGATCGTGGT GGTGGTGACC 
ATCTCGATCG CCACACTGAA GCTCTTCGAC ATCGTCCGCA CGATGACGAA CGGCAACTTC 
AACACGAACG TGATCGCGAC CGAGATGTAC AACCAGGCGT TCCGGTACGG GCAGACCGGA 
CAGGGCTCGG CACTCGCCGT CGTCCTGTTC GTCCTGGTCA TTCCAATCGT CATCTACCAG 
GTACGCAACC TACGTCGGCA GCGGGAGGTA TGA

Protein sequence

MNFDFADEAP KLAMLLYGVV AFVAVVGGLL LLLDAVPARL ARRREARLAA AVAAGKVIEP 
GRRRPRDGLF ALFFLLPAVL MLGIGLVVPA IRTLVLSFKN GDSTEWVGLR NYGWMFDRPE 
IVDILVNTAL WVLLVPLLAT CIGLIYAVLI DRARLEALAK SLIFLPMAIS FVGAGIIWKF 
VYAFRPAEAD QIGLLNQVWV WLGGEPQQWL TNPPLNTLLL IVVMIWIQAG FAMVVLSAAI 
KAIPTDMIEA ARIDGVNAWQ LFWRITVPGI RPALIVVVVT ISIATLKLFD IVRTMTNGNF 
NTNVIATEMY NQAFRYGQTG QGSALAVVLF VLVIPIVIYQ VRNLRRQREV