Gene Sare_2551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2551
Symbol
ID	5706405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2904310
End bp	2905353
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	73%
IMG OID	641272014
Product	ABC transporter related
Protein accession	YP_001537384
Protein GI	159038131
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000325534
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGAACGACG CCGGTCTGAC CCTGGACGAG GTGAGTGCCG CCTATCGAGG GGTCGCCGTC 
CTGCACCGCA TGCGGTTGAC CGCGGCCCGG GGTGAACTCC TGGTCGTGCT CGGCCCCTCC 
GGTGCCGGCA AGTCGACGGT GTTGCGGGTG GTGGCCGGCC TGGAGCCGGT CACGGCCGGC 
CGAGTCCGGA TCGCCGGCCG GGACGTTACC CGTGACCGGC CCGGCCGGCG CAACGTGTCG 
ATGGTCTTCC AGTCGTACGC GCTGTTTCCC CATCTGACGG TCGCCGAGAA CATCGCGTTC 
GGCCTTGTCG TGCGTGACGT CCCGAAGGCG GTAGCGCGCG AGCGGACACG TGCTGCCGCC 
GAGCAGGTCG GCGCGGCCCA CCTGCTCACC CGGCGACCCG GGCAGCTCTC CGGCGGGGAG 
CGGCAGCGGG TCGCGCTGGC CCGGGCGCTG GTCCGTGAGC CGGACGTGTT CCTCCTCGAC 
GAACCGCTGT CCAATCTCGA CCTTGCCCTC CGGGTGCAGA TGCGGGCCGA ACTGCGAGCC 
CTGCACGATC GGCTCGGTGC CACGATGGTG CACGTCACGC ACGATCAGAC CGAGGCACTG 
GTGTTGGCGG ACCGGATCGC GGTGCTGCGC GATGGCCGGG TGGAGCAGGT CGGTACGCCG 
GACGAGATCT GGCACGCCCC GGCGACGAGG TTCGTGGCCC GCTTCGTCGG TTCCCCGGCG 
ATGAACGTGC TTCCCCGCAC CGGCCCGATC CACCCGTCCG GCGACGTCCC TGAGGGGGTG 
GCTGCCGGAC AGGAGATCGG GTTCCGCCCG GAGGCGGTGG TGTTGGGCGC GGTCGACGGC 
GCGGCGGCGA CCGTCGACCG GGTCGAGGTG GTCGGTACGG ACGCCTACGC CTACCTCACC 
CTCGCCGACG GGCACTCGGT GGTTGCCCGG GTGGCCGCCG CCGACCGACC CGCGCGGGGC 
GATGCGGTCC GGGTCGGGGT CCGTTGGGCC GACACGCACC TCTTCGACGC CGACACCGGG 
CTCCGGCACG GGCGTGCGGA GTGA

Protein sequence

MNDAGLTLDE VSAAYRGVAV LHRMRLTAAR GELLVVLGPS GAGKSTVLRV VAGLEPVTAG 
RVRIAGRDVT RDRPGRRNVS MVFQSYALFP HLTVAENIAF GLVVRDVPKA VARERTRAAA 
EQVGAAHLLT RRPGQLSGGE RQRVALARAL VREPDVFLLD EPLSNLDLAL RVQMRAELRA 
LHDRLGATMV HVTHDQTEAL VLADRIAVLR DGRVEQVGTP DEIWHAPATR FVARFVGSPA 
MNVLPRTGPI HPSGDVPEGV AAGQEIGFRP EAVVLGAVDG AAATVDRVEV VGTDAYAYLT 
LADGHSVVAR VAAADRPARG DAVRVGVRWA DTHLFDADTG LRHGRAE