Gene Sare_4179 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4179
Symbol
ID	5703967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4747069
End bp	4748163
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	69%
IMG OID	641273606
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001538959
Protein GI	159039706
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00200112
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACCCTCA TGCGCGGGAG CAGGCACACC CGTGGCAGCG AGCGAAAGGC CGACACCGTG 
TCCCAGTCCA CCGTCCAACC CACGCCCGCC TCCCCCACCC CGGAGGGCGG CCACCTACTC 
GAGGTACGCG ACCTGCACGT CGAGTTCCGC ACCGGGGAGG GCGTGGCCAA GGTGATCAAC 
GGTGTCTCCT ACCACTTGGA CGCCGGGGAG ACCCTGGCCG TGCTCGGCGA ATCCGGCTCC 
GGCAAATCGG TCACCGCCCA GGCGATCATG GGTATCCTCG ACACCCCGCC CGCCGTGATC 
CGCGCCGGAC AGATCCGCTA CCAGGGACGA GACCTGCTCG CCCAGTCAGA GGAGCAACGC 
CGGCAGGTAC GCGGCACCGA GATCGCGATG ATCTTCCAGG ACGCCCTGTC CGCGCTGAAC 
CCGACGTTCC CGGTCGGCTG GCAGATCGGT GAGACGCTCC GCCAACGCGC CGGGATGTCC 
CGCGGCGACG CCCGTCGCCG CGCGATCGAA CTGATGGACC TGGTGAAGAT CCCCGCCGCG 
GCCAACCGGC TCGGCGACTA CCCACACCAG TTCTCCGGCG GGATGCGGCA ACGCGTCATG 
ATCGCCATGG CGCTGGCACT GAACCCGAAG GTGCTCATCG CCGACGAGCC GACCACCGCG 
CTGGACGTGA CCGTGCAGGC CCAGATCATG GACCTGCTGG CCGACCTACG CCGAGACCTG 
CGCATGGCGA TGATCCTGAT CACCCACGAC CTCGGCGTGG TGGCCGGCGT CGCCGACCGC 
ATCGCCGTCA TGTACGCCGG CCGGATCGTC GAACACGCCG ACGTCCGGTC GCTGTACCGG 
TCACCCGCAC ACCCGTACAC CAAGGGGCTG TTGGAGTCGA TCCCACGGCT GGACGTCCAC 
GGCCAACAGC TGTCGACTAT CCGAGGCCTA CCGCCGAACC TGATGCGGAT TCCCTCCGGC 
TGCCCCTTCC ACCCCCGGTG CCCGTACGTC CAGCAGGTCT GCGTGGACGT CGTACCGCAC 
GACCTGGTCC TCGGCGACGG CCGAACCAGC GCGTGCCACT TCGCGCAGGA GGTCCGCGAT 
GACCGCGCCC GCTAG

Protein sequence

MTLMRGSRHT RGSERKADTV SQSTVQPTPA SPTPEGGHLL EVRDLHVEFR TGEGVAKVIN 
GVSYHLDAGE TLAVLGESGS GKSVTAQAIM GILDTPPAVI RAGQIRYQGR DLLAQSEEQR 
RQVRGTEIAM IFQDALSALN PTFPVGWQIG ETLRQRAGMS RGDARRRAIE LMDLVKIPAA 
ANRLGDYPHQ FSGGMRQRVM IAMALALNPK VLIADEPTTA LDVTVQAQIM DLLADLRRDL 
RMAMILITHD LGVVAGVADR IAVMYAGRIV EHADVRSLYR SPAHPYTKGL LESIPRLDVH 
GQQLSTIRGL PPNLMRIPSG CPFHPRCPYV QQVCVDVVPH DLVLGDGRTS ACHFAQEVRD 
DRAR