Gene Strop_3878 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3878
Symbol
ID	5060356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4441533
End bp	4442552
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	64%
IMG OID	640476135
Product	membrane lipoprotein lipid attachment site
Protein accession	YP_001160686
Protein GI	145596389
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAGGC TGACCCGTAC GGTCGCCGCA GCCACGATGG CCGCTGCTCT GGCGATGGTT 
GGGGCGTGTA GCAGCGACTC GGACTCCAAC GAGGGGAGTG ACGGCGCGCT GGAGGAAGTA 
ACCTACCTCA CCTCCTTCGG AAACTTCGGC CGGGACTCCT ACGCCTGGGT GGCGAAGGAG 
AAGGGCTTCT TCCGCGACGC GGGTTTTGAT GTCGAGATCA AGCCGGGGCA GGGCACCGGC 
AGTGTGATTC AGACGGTCTC CGGAGGCAAG GCGGACTTCG GGCCGATCGA CCTCACTGGT 
GGTCTGCTCC AGTTTGGCAA CGGCGAGGCC AAGGACTTCG TCGTCGTCGC CGCGATCCAG 
CAGCGCACCA TGGCCGGCAT CGCCACCGTC GAGGGCACGA ACATCGCCAC GGCGAAGGAC 
CTTGAGGGCA AGAAGATCGC GGACAGCCCC ACCTCGGTGG TCCGTAACCT CTTCCCCACG 
TACGCGAAGA TCGCCGGCGT CGATGCGAGC AAGGTGACCT GGGTCAACGG TCAGCCGCAG 
GACCTGATGG GCACTCTCGC CGCCGGCACC GTCGACGGTA TCGGGCAGTT TGTTGTGGGC 
CAGCCGACCA TTGAGGCGAT CGCCAAGAAG AAGGCGATCA TGCTGCCGTA CAGCGAGTAC 
CTGCAGGACC TCTATGGCAA CGTGCTGATC ACCTCCACGA CGATCGCCAA AGAGAAGCCG 
GAGATGGTCA AGCGGTTCAC CGAGGCCCTG TTGAAGGGCC TGGAGTACGC GTTGGACAAC 
CCGCAGGAGG CAGCGGAGCT GCTGAAGAAG AACGTGGACT CGACAAACGT CGAGTCCGCC 
AAGGCGGAGC TGGAGCTGAT GGCCGGTTAT GTCCGGTCCA GCAACAGCGG TGCCCAAGTG 
GGCACGGTGG ACAGCGCGCG AGTGGCAAAG AGCATCGCCA TCCTGCGGGG TGCGGGAACG 
CTGAAGCAGG AGCTCGAGCC CGACCAGATC ATCGACTTCA GCCTCACACC GAAGTCCTGA

Protein sequence

MRRLTRTVAA ATMAAALAMV GACSSDSDSN EGSDGALEEV TYLTSFGNFG RDSYAWVAKE 
KGFFRDAGFD VEIKPGQGTG SVIQTVSGGK ADFGPIDLTG GLLQFGNGEA KDFVVVAAIQ 
QRTMAGIATV EGTNIATAKD LEGKKIADSP TSVVRNLFPT YAKIAGVDAS KVTWVNGQPQ 
DLMGTLAAGT VDGIGQFVVG QPTIEAIAKK KAIMLPYSEY LQDLYGNVLI TSTTIAKEKP 
EMVKRFTEAL LKGLEYALDN PQEAAELLKK NVDSTNVESA KAELELMAGY VRSSNSGAQV 
GTVDSARVAK SIAILRGAGT LKQELEPDQI IDFSLTPKS