Gene Sare_4210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4210
Symbol
ID	5707948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4778659
End bp	4779696
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	67%
IMG OID	641273629
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001538982
Protein GI	159039729
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.384565
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00766091
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCACTG ATGTGAACGT CCAACTGGAC GCCCTGCCCG GCCTCGACTC GGACGCTCTG 
CCGCTCGAGG TCAAGGATCT GCAGGTCGAG TTCCGCACCC GCAACGGCAT CGCCCGCGCG 
GTCAACGGCG TCAGCTTCAA CCTGCGAGCC GGAGAGACCC GAGCGATCCT CGGTGAGTCC 
GGCTGCGGCA AGAGCGTCAC CGCCCAGGCG ATCATGGGAA TCCTCGACAG CCCACCCGGA 
TTCGTCACCG GCGGGGAGAT CCGCTACCGC GGCGTCGACC TGCTCAAGCT GCCCGAGGCG 
CAGCGGCGGA AGGTCCGCGC CAACCGGATC GCGATGATCT TCCAGGACGC CCTCTCCGCG 
CTGAACCCGG TCTTCACGGT CGGTTTCCAG CTTGGTGAGC TGTTCCGCAA GCACCGGGGC 
ATGTCCCGGT CGGACAGTAA GGCGCGCGCC GTCGAACTGC TCGACCTGGT CAAGATCCCG 
GCAGCGAAGC AGCGGGTGAA CGAATACCCG CACCAGTTCT CCGGCGGTAT GCGCCAGCGC 
GTCATGATCG CTATGGCGTT GGCGCTCGAC CCGGAGGTGT TGATCGCCGA CGAGCCGACC 
ACCGCCCTGG ACGTCACTGT GCAGGCCCAG ATCATGGCGC TGCTCGCCGA ACTACAGCGG 
GAACGGAACA TGGGCCTGCT GCTGATCACG CACGACATGG GCGTGGTCGC CGACGTGGCG 
GACCAGATCT CGGTGATGTA CGCGGGCCGG GTCATTGAGG AAGCCCCGGT CCGGGACATC 
TACGAGAGCC CGGCCCACCC GTACACCAAG GGTCTGCTGG AGTCGATTCC ACGTCTGGAC 
CTCAAGGGTC AGGAACTCTC CGCTATCAAG GGGCTGCCGC CGCTGCTGAC GGACATCCCC 
AAGGGGTGCG CGTTCAACCC GCGGTGCCGG TATGCGCAGG ACGCCTGCCG TCAGGACCCG 
GTGCCGCCGC TGTATCAGGT GGCACCGGTC CGAAGCGCCG CCTGCCACTT CTGGAAGGAG 
GTCAAGGCCG ATGCCTGA

Protein sequence

MSTDVNVQLD ALPGLDSDAL PLEVKDLQVE FRTRNGIARA VNGVSFNLRA GETRAILGES 
GCGKSVTAQA IMGILDSPPG FVTGGEIRYR GVDLLKLPEA QRRKVRANRI AMIFQDALSA 
LNPVFTVGFQ LGELFRKHRG MSRSDSKARA VELLDLVKIP AAKQRVNEYP HQFSGGMRQR 
VMIAMALALD PEVLIADEPT TALDVTVQAQ IMALLAELQR ERNMGLLLIT HDMGVVADVA 
DQISVMYAGR VIEEAPVRDI YESPAHPYTK GLLESIPRLD LKGQELSAIK GLPPLLTDIP 
KGCAFNPRCR YAQDACRQDP VPPLYQVAPV RSAACHFWKE VKADA