Gene Sare_2935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2935
Symbol
ID	5705240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3324517
End bp	3325728
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	66%
IMG OID	641272384
Product	hypothetical protein
Protein accession	YP_001537752
Protein GI	159038499
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.682348
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGGC ATCAGCACGA CGAATCGGCC TGGGTCCTAC GAGGAGGCCT GAATCCGGAT 
ACAGCGAACG TCACCAATGT TCTCACCCAC GTCAGTACCG ACGCAGCGGC AACCCTGTCC 
GAGTCGATGG TGTTGGGTAT TGGTGGCGGC CTCGGCGCTG GCTACCTGTT GTGGGAGGTA 
AACGGCCAGC TTCCGAGCCT CATCCTCGGA TTTCGTTTTC GCTGGAATAT GCACGACTGG 
GCAGAACAGA CCCTGGGGCG GCTCGGGGCG CGCTATCAGG TGCGAACGAC CACGAGCCAG 
GCCCGCGCCG CGGCGATGCT GACCGATTCG ATCGAAGCCG GCCGAGCGCC GATCATCCGG 
CCCGATCGTC AGTTGCTGAG CTACTGGCAC CTGCACCCTG ACACAGACAC GACCCTGGCT 
CCCCCGGTGT ACGCCGGGGC CAGGCGAGGT GCATTGGTAG CCTACGGCCT TGCCGGCGAC 
GGCATCCTTG TCGACGACCG AAACCTGTCA CCCCTTACTG TCGACGCCGC GCTGCTCGCA 
CAGGCCCGGG CGAAGCTGAG TTCGTCGAAG AACTACATGC TCGTCGTCGA TGCCTTCGAC 
ACACCTACTG ACCTGAGCCA GATGATCAGG GCGGGAATCG CCGACTGCGT CGAGCATCTG 
CACGCCTCCT CGACCGCTGT CGCCTTGCCA GCCTGGGAGA AGTGGGCAGG CCTGCTTACT 
GATCGGCGTA ACGCCAAGGG TTGGCCGAAG GTGTATGCCG AAGGTCGAGG GCTTACCTCG 
GCGCTGCTGG CGATCTGGAT GGGCGTCAAT CCCGCCGGCC GTATCGGCGG GGATCTTCGC 
GCCTGCTACG CGGACTTCCT CGACGAGGCG GCCGCCCACC TCGGCTCGGC CGAGGCTGCC 
GCGACAGCGA CCGCTGATCT CTACCGCATC GCCGCTCGGC GGTGGCAGGA GCTTGCGGAA 
GCGGCTCTGC CCAGCGACGT ACCTGAGTTC GCACGGCTAC GGCGGCTCGT CACCGGCATG 
TCCGATGGAG TGGTTGCCGG TGACCAAGGC GTTGACGCGC GTGGCGCGGC GGCAACCGAA 
CTGTGGACCA TGCTCGCGGA GTACGACGCC GATCCACCGG TCATCGTCGA CCTCGCGACG 
CTCGCCGATC GGTTGGGGGC CGTGGCCATG GCGGAGCGTT CGGCAGCAGG ATCCCTTCGT 
CAGCTGGTCT AG

Protein sequence

MKRHQHDESA WVLRGGLNPD TANVTNVLTH VSTDAAATLS ESMVLGIGGG LGAGYLLWEV 
NGQLPSLILG FRFRWNMHDW AEQTLGRLGA RYQVRTTTSQ ARAAAMLTDS IEAGRAPIIR 
PDRQLLSYWH LHPDTDTTLA PPVYAGARRG ALVAYGLAGD GILVDDRNLS PLTVDAALLA 
QARAKLSSSK NYMLVVDAFD TPTDLSQMIR AGIADCVEHL HASSTAVALP AWEKWAGLLT 
DRRNAKGWPK VYAEGRGLTS ALLAIWMGVN PAGRIGGDLR ACYADFLDEA AAHLGSAEAA 
ATATADLYRI AARRWQELAE AALPSDVPEF ARLRRLVTGM SDGVVAGDQG VDARGAAATE 
LWTMLAEYDA DPPVIVDLAT LADRLGAVAM AERSAAGSLR QLV