Gene Sare_5102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_5102
Symbol
ID	5704070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5776775
End bp	5777758
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	71%
IMG OID	641274494
Product	D-alanine--D-alanine ligase
Protein accession	YP_001539835
Protein GI	159040582
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1181] D-alanine-D-alanine ligase and related ATP-grasp enzymes
TIGRFAM ID	[TIGR01205] D-alanine--D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.842129
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000223224
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGGGTACGA CCGCTGCCGA TCCGGCTGTC CTCTTGACCG ACCTGCGCGT GCTGGTACTC 
GCCGGCGGCC TTTCCTATGA ACGGGACGTC TCGCTGCGAT CCGGCCGGCG GGTGCTGGAC 
GCGCTGCGTG CGGTGGGCGT GGAGGCGGAG CTACGCGACG CGGACGTCGC CCTGCTGCCG 
TCACTCGTCG CCGATCCACC GGACGCGGTG GTCATCGCCC TGCACGGTGC CACTGGTGAG 
GACGGTTCAC TTCGCGGTGT GCTGGACCTC TGCAACGTCC CGTACGTCGG CTGCGACGCC 
CGCTCGTCAC GCCTCGCGTG GGACAAACCC TCGGCCAAGG CCGTGTTGCG GGAAGCGGGC 
ATCCCCACCC CGGACTGGGT GGCACTACCT CATGATCGCT TCTCCGAGCT CGGTGCGGTG 
GCGGTACTGG ACCGCATCGT CGACCGCTTG GGGCTCCCGC TGATGGTGAA GCCCGCGCAG 
GGCGGCTCGG GTCTGGGCGC CGCCGTGGTC CGGGATGGTC CGGCCCTACC GGCCGCGATG 
GTCGGTTGTT TCGCCTACGA CTCGACCGCC CTCGTCGAAC GCTACCTGCC CGGAACGGAC 
GTGGCGGTAT CCGTGATCGA CCTCGGCGAG GGGCCGCAGG CCCTGCCGGC GGTGGAGATC 
GTGCCCCGAA ACGGTGTGTA CGACTACGCC GCCCGGTACA CGGCCGGCCG TACCACCTGG 
CACACGCCGG CCCGCCTGGA CACCGAGGTG GCCGAAGCGG TCGCCACGGT CGCCGTCGCC 
GCCCACACCG CGCTCGGGTT GCGCGACCTC AGCCGGGTCG ACCTGATCGT GGATGCCGAC 
CACCAGCCGC ACGTCCTCGG GGTGAACGTC GCACCCGGCA TGACGGAGAC CTCACTGCTA 
CCGCTCGCGG CCCAGGCCGC GAGTCTCGAC TTCGGCCGAA TGATCGGAAC CTTGGTCTCT 
CGGGCCGTTG CCCGGGCCAC CTGA

Protein sequence

MGTTAADPAV LLTDLRVLVL AGGLSYERDV SLRSGRRVLD ALRAVGVEAE LRDADVALLP 
SLVADPPDAV VIALHGATGE DGSLRGVLDL CNVPYVGCDA RSSRLAWDKP SAKAVLREAG 
IPTPDWVALP HDRFSELGAV AVLDRIVDRL GLPLMVKPAQ GGSGLGAAVV RDGPALPAAM 
VGCFAYDSTA LVERYLPGTD VAVSVIDLGE GPQALPAVEI VPRNGVYDYA ARYTAGRTTW 
HTPARLDTEV AEAVATVAVA AHTALGLRDL SRVDLIVDAD HQPHVLGVNV APGMTETSLL 
PLAAQAASLD FGRMIGTLVS RAVARAT