Gene Strop_3846 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3846
Symbol
ID	5060324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	4405842
End bp	4406939
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	67%
IMG OID	640476103
Product	hypothetical protein
Protein accession	YP_001160654
Protein GI	145596357
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAAGG GTTTCCTCGC CGCTGCCGCC GCCGGCCTCC TGGCCACCGG CGGCATGGCG 
GCCTGTGGCG ACAACTCCTC CGACGAGGAG TCGGCCGGCC CCGGCAAAAC CCCCAAGATC 
GGCGTGATCC TCCCGGACAG CAAGTCCTCC GCCCGCTGGG AGGGCGCGGA CCGCAAGTTC 
CTTGAGGATG CCTTCAAGGA GGCCGGAGTC GAGGCCGACA TCCAGAACGC GCAGGGTGAC 
AAAACCCAGT TCCAGACCAT CGCAGACCAG ATGATCACCC AGGGGGTCAC CGCCCTGATG 
ATCGTCAACC TGGACTCCGG CACCGGCAAG GCCGTCCTCG ACAAGGCCAA GTCGCAGGGG 
GTCGCCACCA TCGACTACGA CCGCCTGACC CTCGGTGGCT CGGCGGAGTA CTACGTCAGC 
TTCGACAACG AGGCCGTCGG CAAGCTCCAG GGCGAGGGCC TCGTCAGGTG CCTCACCGAC 
GGCGGCGTGC AGAACCCGTC GATCGTGTAC CTGAACGGCG CGCCGACCGA CAACAACGCC 
ACCCTGTTCA AGAACGGCTA CGACTCGGTC CTCAAGCCGA AGTTCGACGC CGGGGAGTAC 
CAGCAGGTCG CGGACGACTC CGTGCCGGAC TGGGACAACG CGCAGGCCGC CACCATCTTC 
GAGCAGCAGC TCACCAAGTC CGGCGGCAAG ATCGACGGGG TGCTCGCGGC GAACGACGGC 
CTCGGCAACG CCGCCATCTC GGTGCTGAAG AAGAACAAAC TCAACGGCAA GGTCCCGGTC 
ACCGGCCAGG ACGCTACCCC GCAGGGCCTA CAGAACATCC TCGCCGGCGA CCAGTGCATG 
ACCGTCTACA AGGCAATCAA GCAAGAGGCC GACGCCGCTG CCGAACTGGC CATCTCGCTG 
GCCAAGGGGG AGCGGAAGGA GACCGGCCAG AGCGTCGAGG ACCCGGAGAG CGGCCGGGAT 
GTGCCCGCCG TGCTGCTCAC CCCCCAGGCG ATCTACAAGG AGAACGTCAA GGACGTCATC 
GCCGACGGCT TCGTGACCAA GGACGAGGTC TGCACCGGGG AGTACGCCGA ACTCTGCGCG 
AGCGCTGGTA TCAGCTGA

Protein sequence

MRKGFLAAAA AGLLATGGMA ACGDNSSDEE SAGPGKTPKI GVILPDSKSS ARWEGADRKF 
LEDAFKEAGV EADIQNAQGD KTQFQTIADQ MITQGVTALM IVNLDSGTGK AVLDKAKSQG 
VATIDYDRLT LGGSAEYYVS FDNEAVGKLQ GEGLVRCLTD GGVQNPSIVY LNGAPTDNNA 
TLFKNGYDSV LKPKFDAGEY QQVADDSVPD WDNAQAATIF EQQLTKSGGK IDGVLAANDG 
LGNAAISVLK KNKLNGKVPV TGQDATPQGL QNILAGDQCM TVYKAIKQEA DAAAELAISL 
AKGERKETGQ SVEDPESGRD VPAVLLTPQA IYKENVKDVI ADGFVTKDEV CTGEYAELCA 
SAGIS