Gene Sare_4657 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4657
Symbol
ID	5705714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5276875
End bp	5277966
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	67%
IMG OID	641274055
Product	ABC transporter related
Protein accession	YP_001539401
Protein GI	159040148
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.400776
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.472803
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACGG TTACCTACGC CAAGGCGTCC CGGATCTACC CGGGCACCGA GCGGCCCGCC 
GTCAACCAGC TCGACCTGGA GATCGGCGAC GGCGAGTTCC TGGTCCTGGT CGGCCCCTCA 
GGTTGCGGTA AGTCCACCAG CCTGCGCATG CTCGCCGGCC TTGAGGACGT TGACGAAGGT 
TCGATCTCCA TCGACGACCG GGACGTCACC CACCTGCCGC CGAAGGCCCG CGACATCGCA 
ATGGTCTTCC AAAACTACGC CCTCTACCCG CACATGTCGG TGTACGAGAA CATGGCGTTC 
GCCCTCAAGC TGCGCAAGAC GCCAAAGGCG GAGATCGACC GGCGGGTCAA GGAAGCGGCG 
ACGCTGCTCC AGTTGGAGGA GTACCTCGGC CGCAAGCCGA AGGCGCTCTC CGGCGGCCAG 
CGCCAGCGGG TGGCCATGGG CCGAGCGATC GTCCGCGAGC CGCAGGTCTT CCTGATGGAC 
GAGCCCCTGT CGAACCTCGA CGCCAAGCTG CGGGTGCAGA CCCGCACGCA GATCGCGTCC 
CTACAGGCCA AGCTCGGTGT GACCACCGTC TACGTCACCC ACGACCAGGT TGAGGCCATG 
ACCATGGGTC ACCGGGTGGC GGTCCTGCTC GACGGCGAAC TCCAACAGGT CGACACGCCG 
CGGGCGCTCT ACGACACCCC AGCCAACGTC TTCGTCGCCG GATTCATGGG CTCGCCGGCG 
ATGAACATCA AGACCGTGCC GCTGAGCGAG AATGGTGCCG AGTTCGCCGA GATGCACATC 
CCGCTGACCC GCGAGCAGGT CGAGGCGGCC CGCGCCGAGG GTGGTGACGA CAAGGTGGTG 
GTGGGCTTCC GCCCGGAGGA CTGCGAACTG GTCAGCCCGA CCGAGGGGGG CATGCCGGTC 
GTCGTCGAGC TGGTTGAGGA CCTCGGATCG GACGCGAACA TCTACGGCCA CGCCGCGTTG 
GAAGGCGCCA ACGAACGGTT CGTGGTGCGC ACCGACCGGC GCACCATGCC CAACATGGGT 
GGCACCGTGT TCGTCAAGCC GCGGGCCGGC CGCAGCCACG TCTTCAACGC GAAGACCGGC 
CGCCGGATCT GA

Protein sequence

MATVTYAKAS RIYPGTERPA VNQLDLEIGD GEFLVLVGPS GCGKSTSLRM LAGLEDVDEG 
SISIDDRDVT HLPPKARDIA MVFQNYALYP HMSVYENMAF ALKLRKTPKA EIDRRVKEAA 
TLLQLEEYLG RKPKALSGGQ RQRVAMGRAI VREPQVFLMD EPLSNLDAKL RVQTRTQIAS 
LQAKLGVTTV YVTHDQVEAM TMGHRVAVLL DGELQQVDTP RALYDTPANV FVAGFMGSPA 
MNIKTVPLSE NGAEFAEMHI PLTREQVEAA RAEGGDDKVV VGFRPEDCEL VSPTEGGMPV 
VVELVEDLGS DANIYGHAAL EGANERFVVR TDRRTMPNMG GTVFVKPRAG RSHVFNAKTG 
RRI