Gene Sare_4238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4238
Symbol
ID	5708088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4811288
End bp	4812550
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	68%
IMG OID	641273657
Product	monosaccharide-transporting ATPase
Protein accession	YP_001539010
Protein GI	159039757
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4214] ABC-type xylose transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0284678
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0915708
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGCA CCGCCCTCCC CGACCAGGAT TCCGCGGCCA CCCCCGCCGC CGGTCCCACC 
CTCGCCAACC ACTTTCGCGG CTACGTCAGC CGGGTACGCG GCGGAGACAT CGGCGCCCTA 
CCCGCCGTCC TCGGCCTGAT CGTGCTCTGT ACCGTCTTCT CGATCATGCG GCCGTCGTTC 
CTCACCGCGG CCAACTTCGC CAACCTGTTC ACACAGGGGG CGGCGGTCAC GCTGATCGCC 
ATGGGGCTGG TCTTCGTCCT GCTGCTCGGC GAGATCGACC TCTCCGCCGG CTTCGCCAGC 
GGGGTGTGCG CCGCCGTACT GGCCAACGTG GTCACCGTCC TCGGCTACCC GTGGTACGTC 
GCGGTACTCG CCGCCCTCCT CACCGGAGTG GTGATCGGCA GTACGCTTGG CATCCTGGTC 
GCGAAGATCG GCATCCCGTC CTTCGTGGTC ACCCTCGCCG GTTTCCTCGC CTTCCAGGGC 
CTCGTGCTAC TGCTGATGGA AGACGGCAGT AACATCTCGG TCCGGGATCC GGTGCTGGTG 
GCCATCGCGA ACCGAAACCT CCCACCAGCG GTCGGCTGGA TCCTGGCCGG GCTCGCCGTC 
GCCGGCTTCG CCACGGTCCA GGCGATGCGG CAGCGCACGC GCGCGCTCCG CGGTCTGGTC 
ACCGACCCGC TCGCCGTGGT GCTCGCCCGG GTCGGCGGGC TGGCTGCCGT CCTGGGCACG 
ACCGTCTACA TCCTCAACCA GGAACGCAGC TTCAACACTT TGATCAACTC GCTCAAGGGT 
GTGCCGATCG TGGTGCCGAT CATCGCGGTG CTGTTGATCG CCTGGACCTT CGTCCTGCGG 
CAGACCAGCT ACGGACGGCA CATCTATGCG GTCGGCGGCA ACAGAGAAGC GGCCCGCCGG 
GCCGGCATCA ACGTCGACCG GATCCGCATC TCCGTCTTCG TGATCTGTTC CTCGATGGCC 
GCGATCGGCG GCATCGTCGC AGCCAGCCGG GCCAACTCGG TCGACCCGAA CACCGGTGGC 
AGTAACGTAC TGCTCTACGC CGTCGGTGCG GCGGTGATCG GCGGCACCAG CCTCTTCGGC 
GGCAAGGGCC GGGTCCTCGA CGCGGTACTC GGCGGCGCAG TCGTCGCGGT GATCGACAAC 
GGGATGGGTC TGATGGGCTA CAGCTCAGGG GTCAAGTACG TGGTCACCGG CGTGGTACTT 
CTCCTCGCCG CCAGTGTGGA CGCGCTGTCC CGACGCCGAG CCGCCGCCAG CGGCGGCCGA 
TGA

Protein sequence

MTSTALPDQD SAATPAAGPT LANHFRGYVS RVRGGDIGAL PAVLGLIVLC TVFSIMRPSF 
LTAANFANLF TQGAAVTLIA MGLVFVLLLG EIDLSAGFAS GVCAAVLANV VTVLGYPWYV 
AVLAALLTGV VIGSTLGILV AKIGIPSFVV TLAGFLAFQG LVLLLMEDGS NISVRDPVLV 
AIANRNLPPA VGWILAGLAV AGFATVQAMR QRTRALRGLV TDPLAVVLAR VGGLAAVLGT 
TVYILNQERS FNTLINSLKG VPIVVPIIAV LLIAWTFVLR QTSYGRHIYA VGGNREAARR 
AGINVDRIRI SVFVICSSMA AIGGIVAASR ANSVDPNTGG SNVLLYAVGA AVIGGTSLFG 
GKGRVLDAVL GGAVVAVIDN GMGLMGYSSG VKYVVTGVVL LLAASVDALS RRRAAASGGR