Gene Sare_1556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1556
Symbol
ID	5706758
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1790675
End bp	1792309
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	74%
IMG OID	641271067
Product	hypothetical protein
Protein accession	YP_001536443
Protein GI	159037190
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0139202
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCTCCG GCTTCGGTGA ACTGACTGAC CACGCGCATC ATCTGGTGGC TACCGGCGAC 
CTCGCCGGCG CCCAGCGGCT GCTCTCCGAC GCGCTGACCG ATGCCGATCC ACGGCCTGCC 
CATGCCAGCG CCGAGTTGGC CGAGTTGGCG AGTCTGCAGG CGCGGGTGCT GGTCGCGCTC 
GGCGACCCGC AGTCCGCGCG GGGCTGGGCG GCCTACGCGT ACGCGGCCAG CAACCACCTG 
CACGGCCGTT CGGACGAACG TACGGTCGCG ACGGCCGCCA CCCTGGCCGC CGTGCTGCAC 
CGGGTCGGTA GCTGGTCCCG GGCGGCGCGG GTCTACCAGG AGGTCATCAT CGAGCTGACC 
GCCTTGGACG GCCCCGAGTC GCTGCGCGTA CTCGCCGCGC ACGCTGACCT GGCCACGATG 
GAGTACGCCC GTGGCCACTG CCAGGCGGCC CGTGACCGGC TCGCCGACGC GTGGGAGCTG 
CACCGCGAGG TGTACGGCGA TGGGCATCCC AGTGGCATCA AGATGCTGGC CCGGCTCGGC 
GCGATGCAAC GCGACTGTGG GCTGTCCGGT TCCGCGCACG AGAGCCTGGC GCTGGCCGGG 
GAACTGTGCC GGCAGCACCT GACCGCGGAC GACCCGCTCG CGGTGCAGGT TGCCGCGCTC 
GGGCGGGCGG CGGCCGATCC GGCGCACAGC TGCGCCGGCG TCACACCGGA CGGGCGGGAG 
GCTCCGATCG TGCCGGCCGC CCGCACGCCC CCGCCAGGGG ACGTGCCGCC CTACGATGCC 
GAGCCGCAGC ATCCGTCGCA GCCCGGATAC CGACCCGCCG ACCCGTACCT GCCGCCGGAG 
CCGGACCGGC CGGTGGTCAA GGAGCATCCG GCGGCCGGGT ATTCCCCGCC GCTCACGGTC 
CCGACGCCCC GGCAACCGGT GGACGGTGCC GCGGTCGAAG AGTCGACCGA GTCACCCGAG 
CAGGGTTCGG GCGGGGCGGA GCACGACCCG TGGCGGCGTG AGCCGTCGGC CGAGGAGTGG 
GGCACCGCCG TGCCCCCGTC GGTGCTGCCG CTGGCTCACG GCGACGACGG TGGGCTGTCG 
GGCTGGAGGG ATCTGGAGGA GGCCGACGGG GTCCGTCGGG TCGCGCCGCG GGAGACGCCC 
GACGAGCCGG CGGACCTGCC GTCGCGGCTG CTGCCGGTGC CGGTGCCTCG TGCCTCGCCG 
CCGTCTCGCA AGCGGCTGTT GCTGCTCGTG GCGGGTGGTG TGGTGGTGCT GCTGGGGACG 
CTCGCGGTGA TCGCGGGGGT GTCCCGCTTC GCTGGGGCAG CGTCGGTGGC GACCAGCCCA 
CCGGCCCAGG TCACCGCTAC TCCCGCCGCA TCCGCGGCGG CTGCCGGCAC CCCACCCGGT 
GAGCTGACTC TGAGTGACAA CCAGGACAGT GTCGCGCTGC GTTGGACGTA TCCGGCGGGG 
GGTGAGGGTC CGGTGGTGGT CTCGGGTGGC CAGCCCGGCC AGCCGCAGAC CGTTTTCGCC 
AACCTACCCG CCGGCACCAC CGACTTCGTC GTGTACGGGC TCAACGGTGG CGTCGACTAC 
TGCTTCGCCG TGGCGGTGGT CTGGTCGACG GAGACGATCG CCCGGTCGGG GGAGGTCTGC 
ACCAACCGCG GGTGA

Protein sequence

MPSGFGELTD HAHHLVATGD LAGAQRLLSD ALTDADPRPA HASAELAELA SLQARVLVAL 
GDPQSARGWA AYAYAASNHL HGRSDERTVA TAATLAAVLH RVGSWSRAAR VYQEVIIELT 
ALDGPESLRV LAAHADLATM EYARGHCQAA RDRLADAWEL HREVYGDGHP SGIKMLARLG 
AMQRDCGLSG SAHESLALAG ELCRQHLTAD DPLAVQVAAL GRAAADPAHS CAGVTPDGRE 
APIVPAARTP PPGDVPPYDA EPQHPSQPGY RPADPYLPPE PDRPVVKEHP AAGYSPPLTV 
PTPRQPVDGA AVEESTESPE QGSGGAEHDP WRREPSAEEW GTAVPPSVLP LAHGDDGGLS 
GWRDLEEADG VRRVAPRETP DEPADLPSRL LPVPVPRASP PSRKRLLLLV AGGVVVLLGT 
LAVIAGVSRF AGAASVATSP PAQVTATPAA SAAAAGTPPG ELTLSDNQDS VALRWTYPAG 
GEGPVVVSGG QPGQPQTVFA NLPAGTTDFV VYGLNGGVDY CFAVAVVWST ETIARSGEVC 
TNRG