Gene Sare_3043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3043
Symbol
ID	5707245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3450446
End bp	3451840
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	61%
IMG OID	641272486
Product	hypothetical protein
Protein accession	YP_001537854
Protein GI	159038601
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGGGA AGGACACCAA CACTGCGATG AATGATCAGC GTTATGACCA CGAACTGGAT 
CGGCCGGGTG CGCGCTGGGC GAGGTCACGG TGGTGGGCGG TTGGGCTGGC CGGTATGACC 
GGCCTGGCTC TCACCGCCAG CCTCGGCATC GGTGGCGCGC CGGCTATCGG CGCCGTCGAC 
GGCACTGTCA CCGCCGCCGA CGACCGGCCG GGAAAACCTG ACCGCGCCTC CACCGACAAC 
AAGGACCACG AGGGCAAGGC AAAGCAGGGC AAACACAAGG GCACACCGGT CCCGTGTAGC 
GCCGATGCGC TGATCGCGGC GATCACCCTG GGCAACGCCC GCGGCGGCGC CGTGCTCGAC 
CTCGCCAAGG GCTGCACCTA CCTGCTCACC GCGAACATCG ACGACGGTGC CGGTCTGCCC 
GCCATCACCG CCCCGATCAC CCTCAACGGC GGCAAACACA CCAGCATCAC CCGCGCCGCC 
GCCGCCGAAC AATTCAGAAT CTTCACCGTC CAGATCGGCG GCCACCTCAC TCTCAACCAC 
CTCACCATCA CCGGCGGGGA GATAAACGCC GACGGCGGAG GGGTTCTTGT CATCTCCGGC 
GGAGCGCTGA CCACTAACCA CAGCACCATC ACCCGCAACG TCGCGAACGA CGGTGGTGGC 
ATCGACAACT TTGGTGTCAC CACTATTAAT CACAGCATCG TCAGCCATAA CATCTCCCAG 
GGATTCGGTG GCGGCGTTTC AAACTCTCAG GGAACATTAA GTATCAACAA TTCTCACATA 
ACCGCTAACA CGTCCAGCGA AGGCGGCGGC GTAGTGAGTT TCGATATGGC TAGCGCCGTA 
ACGATAAGGA AGAGTGTGTT CGCCGACAAT TTCTCCCGGG GAGGGAGCGG AGGCTTGGCT 
GTTAGAAGCG GAATCGGTCA AATCTCCGAT ACAACCTTCA CGAACAATCG CGCGAGTAAC 
TTCGCTGGTG GAGTCTACAT CGACCGGCCC GCCACTCTGC GGAACGTGGA GATCGTAAAA 
AACACGGCGT TAACGCGGAT GGCCGGAGGG CTATTTGTAG ACATTAACGC GGCAGTCGTT 
GTTGACAAAA GTTTGATCAA GGACAACGAC TCTATCGCCG CCATCGGTGG CGGCGTATAC 
AACACAGGTC AGCTGGTGAT GCGAAAGACA ACGGTCATCG GCAACCGGGC CGACCAAGGC 
GGCGGAATCT ACAACGACGC CAACGGTACG CTCCCGCTCT TTTCGACCAA GATTGTCAAG 
AATGTCGCCA TCCTCGATGG AGGAGGCATC TTCAACAATG GTGGCACGGT CGAGTTGAAC 
ACCGTCACTG GAACCACTGT GGTCAAGAAC CGGCCGGACA ACTGCTCCGG CGACGTACCC 
GGCTGCGCCG GATAG

Protein sequence

MTGKDTNTAM NDQRYDHELD RPGARWARSR WWAVGLAGMT GLALTASLGI GGAPAIGAVD 
GTVTAADDRP GKPDRASTDN KDHEGKAKQG KHKGTPVPCS ADALIAAITL GNARGGAVLD 
LAKGCTYLLT ANIDDGAGLP AITAPITLNG GKHTSITRAA AAEQFRIFTV QIGGHLTLNH 
LTITGGEINA DGGGVLVISG GALTTNHSTI TRNVANDGGG IDNFGVTTIN HSIVSHNISQ 
GFGGGVSNSQ GTLSINNSHI TANTSSEGGG VVSFDMASAV TIRKSVFADN FSRGGSGGLA 
VRSGIGQISD TTFTNNRASN FAGGVYIDRP ATLRNVEIVK NTALTRMAGG LFVDINAAVV 
VDKSLIKDND SIAAIGGGVY NTGQLVMRKT TVIGNRADQG GGIYNDANGT LPLFSTKIVK 
NVAILDGGGI FNNGGTVELN TVTGTTVVKN RPDNCSGDVP GCAG