Gene Sare_4236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4236
Symbol
ID	5708086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4809274
End bp	4810371
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	66%
IMG OID	641273655
Product	hypothetical protein
Protein accession	YP_001539008
Protein GI	159039755
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0383732
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAAGG GCTTCCTCGC CGCTGCCGCC GTCGGCCTGC TGGCCACCGG CAGCATGACG 
GCCTGTGGCG ACAACTCCAC CGACGGGGAC CAGACCGGTT CCGGCAAGAC CCCGAAGATC 
GGCGTGATCC TTCCGGACAG CAAGTCCTCC GCCCGTTGGG AAGGCGCCGA CCGCAAGTTC 
CTCCAAGAGG CATTCGCGGA GGCCGGGGTC GAGGCCGACA TCCAGAACGC GCAGGGTGAC 
AAGACCCAGT TCCAGACGAT CGCCGACCAG ATGATCACTA AGGGTGTCAC CGCACTGATG 
ATCGTCAACC TGGACTCCGG CACCGGCAGA GCCGTCCTCG ACAAGGCCAA GTCGCAGGGT 
GTCGCCACCA TCGACTACGA CCGACTGACC CTCGGTGGCT CGGCGGAGTA CTACGTCAGC 
TTCGACAACG AGGCCGTCGG CAAACTTCAG GGTGAAGGCC TCGTCAGGTG CCTCACGGAC 
AGCGGCGTCG AGAACCCGTC GATCGCGTAC CTGAACGGCT CGCCGACCGA CAACAACGCC 
ACTCTGTTCA GGAACGGCTA CGACTCGGTC CTGAAGCCGA AATTCGACGC CGGGGAGTAC 
CAACAGGTCG CGGACGACTC CGTGCCGGAC TGGGACAACG CGCAGGCCGC CACCATCTTC 
GAACAGCAAC TCACCAAGAC TGGCGGCAAG ATCGACGGGG TGCTCGCGGC CAACGACGGC 
CTCGGCAACG CCGCGATCTC GGTGCTGAAG AAGAACAAAC TCAACGGCAA GGTCCCGGTC 
ACCGGCCAGG ACGCCACCCC GCAGGGCCTA CAGAACGTTC TCGCCGGGGA CCAGTGCATG 
ACCGTCTACA AGGCGATCAA GGAAGAGGCC AGCGCCGCTG CCTCCCTGGC CATCGCGCTC 
GCCCAGGGAG AGCGGAAGGA GACCGGCCAG ACGGTCAAGG ACCCGGAGAG TGGCCGGGAC 
GTACCCGCCG TGCTGCTCAC CCCCACGGCG GTCTACAAGG AAAACGTCAA GGACATCATC 
GCCGACGGCT TCGTGACCAA GGACGAGATC TGCACCGGGG CCTACGCCCC GCTCTGCGCG 
AGCGCCGGCA TCAGCTGA

Protein sequence

MRKGFLAAAA VGLLATGSMT ACGDNSTDGD QTGSGKTPKI GVILPDSKSS ARWEGADRKF 
LQEAFAEAGV EADIQNAQGD KTQFQTIADQ MITKGVTALM IVNLDSGTGR AVLDKAKSQG 
VATIDYDRLT LGGSAEYYVS FDNEAVGKLQ GEGLVRCLTD SGVENPSIAY LNGSPTDNNA 
TLFRNGYDSV LKPKFDAGEY QQVADDSVPD WDNAQAATIF EQQLTKTGGK IDGVLAANDG 
LGNAAISVLK KNKLNGKVPV TGQDATPQGL QNVLAGDQCM TVYKAIKEEA SAAASLAIAL 
AQGERKETGQ TVKDPESGRD VPAVLLTPTA VYKENVKDII ADGFVTKDEI CTGAYAPLCA 
SAGIS