Gene Strop_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2006
Symbol
ID	5058469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	2276570
End bp	2277607
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	66%
IMG OID	640474272
Product	extracellular solute-binding protein
Protein accession	YP_001158838
Protein GI	145594541
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID	[TIGR03227] 2-aminoethylphosphonate ABC transporter, periplasmic 2-aminoethylphosphonate binding protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.569092
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.043558
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACGCA CCCCCCTGGC TCTCGCCACC CTCGCGGTGG CCTCGCTCGC GCTCGCCGCG 
TGCGGATCAG GCACCTCCGA CCCGGGTGGG GCTGACGGCG ACAAGACCGT CACCGTCTAC 
TCCGCCGACG GGCTCGGCGA CTGGTACAGC AAGCAGTTCG TCGAGTTCGA GAAGCAGACC 
GGCATCAAGG TACAGATGAT CGAGGCCGGC TCCGGTGAGG TCGTCTCTCG GCTACAGAAG 
GAGAAGGCGA ACGTCCAGGC GGACCTGGTC GTCACGCTGC CGCCCTACAT CCAGAAGGCC 
GACGCCGACG GGCTGCTACA GCCTTACACG CCGGCCGGCG CCGACCAGGT GACCGGTGCG 
ACCGACACCT ACGTGCCGTT GGTGAACAAC TACCTCTGCT TCATCTATAA CCCGGACAAG 
GTCGACGCCG CCCCGACGAC GTTCGACGAT CTGCTCAGCC CCGTGTTCGC CAAGAAGCTT 
CAGTACTCGA CGCCCGGCCA GGCGGGTGAC GGCACCGCCG TGCTGCTGCA CCTGCAGCAC 
ATCCTCGGCA AGGACAAGGC ACTGGAGTTC CTGGCGAAGC TCGAAACGAA CAACGTCGGC 
CCGTCGTCGT CCACCGGCAA GTTGCAGCCC AAGGTCAGCA AGGGCGAGAT CTACGTGGCC 
AACGGCGACG TGCAAATGAA CCTCGCGTCG ATCAACAACG ACAGGTCCAA CTTCAAGATC 
TTCTTCCCGG CCGGTCCGGA CGGCAGGGCA TCCACCTTCT CCATCCCGTA CACCATGGGC 
CTGGCCGCCG GCGCCCCACA TGCCGACGCC GGTCGCGAGC TGGCCGACTT CCTACTCTCC 
ACCACTGCCC AGGAGCAGGT GTCCCAGCAG GCGTACGGCG TCCCGGCACG TGCCGACGTC 
AAGCCCGCTG ACAAGCAGTT CCAGCAGGTC GAGCAGGCGC TGCAGGGCGT GGAGATCTGG 
CCGGCCGACT GGGCGAAGAT CCTGACCGAG ATGGACGCGG ACATCGCGGC CTACAACGAG 
GCCCTCGGCC TGGCATAA

Protein sequence

MRRTPLALAT LAVASLALAA CGSGTSDPGG ADGDKTVTVY SADGLGDWYS KQFVEFEKQT 
GIKVQMIEAG SGEVVSRLQK EKANVQADLV VTLPPYIQKA DADGLLQPYT PAGADQVTGA 
TDTYVPLVNN YLCFIYNPDK VDAAPTTFDD LLSPVFAKKL QYSTPGQAGD GTAVLLHLQH 
ILGKDKALEF LAKLETNNVG PSSSTGKLQP KVSKGEIYVA NGDVQMNLAS INNDRSNFKI 
FFPAGPDGRA STFSIPYTMG LAAGAPHADA GRELADFLLS TTAQEQVSQQ AYGVPARADV 
KPADKQFQQV EQALQGVEIW PADWAKILTE MDADIAAYNE ALGLA