Gene Sare_1116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1116
Symbol
ID	5706059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1260481
End bp	1261590
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	71%
IMG OID	641270631
Product	hypothetical protein
Protein accession	YP_001536015
Protein GI	159036762
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0131047
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTGCG CGGTGCTGCT GGTCGCCTCC GGTTGCAGCT TCGGCGAGCC AGGACCCGAC 
CCAGCCGGTG AGCCGCCCAT CCTCCCCACC CCGTCAACCA GCCGGGACGG CACCGGCTCT 
GAGGTGGTGG CCACCGTGCT GGCGAAGGGG CTGCGCGTGC CGTGGGGCAT CGCCTTTCTG 
CCGGACGGCG GTGCGCTGGT GACCGAGCGG GACTCGGGCC GGATTCTCCA GGTAGGGCCC 
GAGTCTGAAC CCGACGGGCT GCGGGTGACC GAGGTGCAGA CCCTCGCCGA GGTGACCGCG 
GGTGGCGAGG GCGGTCTGAT GGGAATCGCC GTCTCACCGG ACTACCAGCA GGACCGCACG 
GTCTTCGTCT ACTACACGGC CGAGCGGGAC AACCGCATCG CCCGACTCAC CCTCGGCGAG 
CCGCCGCGCC CGATCCTGAC CGGCATTCCG AAGGCGCGCA CCCACAACGG CGGTGGCCTC 
GCCTTCGGAC CGGACGGGCA GCTCTACGCC AGCACCGGCG ACGCCGGCGA CCGAAACCAG 
GCGCAGGACG ACAAGCGGCT CGGCGGAAAG ATCCTCCGGA TCACCACCGA CGGCGAGCCG 
GCACCGGGCA ATCCGTTCCC CGACTCGCCC GTGTGGTCGC TGGGGCACCG CAACGTGCAG 
GGCTTCACCT GGACAGATGG CCGAATGTAC GCCGTCGAAT TCGGCCAGAG CACCTGGGAC 
GAGATCAACG TGGTCGAAAA GGGACGTAAC TACGGTTGGC CGGCCGTCGA GGGCCGCTCC 
GACGACCGGC GATACGTCAA CCCGATCGTC CAGTGGCCGA CCTCGGACGC CTCCTGCTCC 
GGGCTGGCCC ACGCGGAAAG TGTCCTCGCC ACGGCCTGCC TCCGCGGTCG GCGACTCTGG 
CTGGTCGAGC TGACCGGCAC CGGAACCGTC CTCGGCCAGC CGCGCGACCT GCTGACCAAC 
CAGTACGGCC GGTTACGGGC GATCGCCGCG GCACCGGATG GCTCGTTCTG GGTGAGCACC 
TCGAACCACG ACGGGCGCGG AGATCCGGTA GCGGAGGACG ACCGGCTCCT GCGGCTGGTG 
TTCGCCGACG GCGGAGCCGG GCGAAGCTGA

Protein sequence

MSCAVLLVAS GCSFGEPGPD PAGEPPILPT PSTSRDGTGS EVVATVLAKG LRVPWGIAFL 
PDGGALVTER DSGRILQVGP ESEPDGLRVT EVQTLAEVTA GGEGGLMGIA VSPDYQQDRT 
VFVYYTAERD NRIARLTLGE PPRPILTGIP KARTHNGGGL AFGPDGQLYA STGDAGDRNQ 
AQDDKRLGGK ILRITTDGEP APGNPFPDSP VWSLGHRNVQ GFTWTDGRMY AVEFGQSTWD 
EINVVEKGRN YGWPAVEGRS DDRRYVNPIV QWPTSDASCS GLAHAESVLA TACLRGRRLW 
LVELTGTGTV LGQPRDLLTN QYGRLRAIAA APDGSFWVST SNHDGRGDPV AEDDRLLRLV 
FADGGAGRS