Gene Sare_2621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2621
Symbol
ID	5703877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2985991
End bp	2987604
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	71%
IMG OID	641272082
Product	cell wall anchor domain-containing protein
Protein accession	YP_001537452
Protein GI	159038199
COG category
COG ID
TIGRFAM ID	[TIGR01167] LPXTG-motif cell wall anchor domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTCG GCGCACCCGG CCTCGCCCTG GCGATCCTGG TGCTGGCCGC AGGGGCCGGG 
CCGGCCATCG CCGAGCCCGC CGCGATCACC GCGACCGGCG CGGACCTGGT CTCGGTGGCT 
CTTGATGGTG ACGCGATGTC GCTGCGGATC CGAGACGCCG CCCAAGTGGC CCGCGAGGCA 
CCAGGGCACG ATCCGGCCGA GTTCGTGCTC GGCCCCGACG GCGGCCTGGC CGGCCGGGTG 
CCGGCCGGAG AAGCCTTTGC CTTCCTCGGC CCGCCGGGCC AGCCGGTGTG GTCGCTGTCC 
GCCGGCGACA CCGGGTTCCC GGCCCTGGAC ACCACTGGAG TACGCCCCGG CGTCCTCGAC 
GACGGCATGG TGACCCTCAG CCTGCGTTCG ATCGACGGGC CGGGAACGTT CACCGCCTAC 
AGGCTGTCGA GCATCGGGCG GGTGACTGCA TTGTTCGGCA GCGGTACGAA TGTGACGCGG 
TCTGTTCAAC TAGCGGCGGC AACGCGCACC GGTGGTGTGG TGTGGGCTTT CGACGCCGCT 
GGCGACTATC GGCTCACCCT GGCCGCATCG GCGGGCCTGC ACTCCGGTAA GACGGTTAGC 
GCTGAGGCGA CATATCGGAT CCGCGTACCC GCGATCATGC CGCCCGGACA GATGCTGCCA 
TCGGCGGCAC CACAGCAGAC AACGCGGCCC GACGGCCACC CGACGGTACA GACGTTCGCT 
GCTCCCGCTG CCGAACCGAA GCTCGCTGCC GAACCGAAGC CCGCCGCGGA ACCGAAGCCC 
GCCGCCGCGC CGGCGGCACC GGCCGCGAGG GTGGCGGCCG CCACCAGCAA GGGCGTGCGG 
CACGTGATCG CCGATGGGCA CGTCGACATG GGCCCGCAGC TGTCCGGAGA CACCTGGACG 
ATCCGGATCA AGGACGACCG AAGCAGCCCC GCGGTGTGGC GGGAAACCGC TGACGTGGTC 
TTGCACATCA AGGACAACGC GAAGATCACC GTGCCTGCCG GCGCGGACTT CCTCGGTAGA 
CAGGGCGACA CGGTGTGGCT GCTCCCGCAG TCCCAGCAGG CCGGCATCGT CTGGCCAGGC 
TGGAACACCC AGCACCAGTC CGTCGTGTCC GGCGTCAAGG GCAACGTCAC CTGGACGCTC 
CGGGGCGTCA ACGGGCCGGG CCGGTTCGCT CTGTTCCTGA CCGGCTCGTT CGGCAAGGCC 
GACGTGCTGT TCGACTCCGC CAAGTCGTTC CCGCAACAAC TGGCTGTCCC GCTGAACACT 
CACGCGCACG GGAACTGGGC GTTCACCAAA CCCGGCCTGT ACCGCCTCGC GGTGCAGATG 
AGCGGCACCA CCACCGCCGG CAAGGCGGTC ACCGACACGA AGACGCTCAC CATCGCCGTT 
GGTGACAGCA CCGACCCGAC GGTCGGCTTC GGACCGGGCA GTGCTTCCGA AGGCGGCGGG 
GAGAACAACG GGAAGGACCA GGGTGGTACA GGCCCGCTGC CGCGTACCGG TGTTGGCTGG 
GTGCTGTCGG CCGGCGCGGC CGGCATGGGC CTCGTCGCCG CCGGGGTCTT GCTGGTGCTG 
CTCGCCCGCC GCCGCTGTAC CGGCCCCGCT GACCGCGCAG TGGGGAACCA GTGA

Protein sequence

MRVGAPGLAL AILVLAAGAG PAIAEPAAIT ATGADLVSVA LDGDAMSLRI RDAAQVAREA 
PGHDPAEFVL GPDGGLAGRV PAGEAFAFLG PPGQPVWSLS AGDTGFPALD TTGVRPGVLD 
DGMVTLSLRS IDGPGTFTAY RLSSIGRVTA LFGSGTNVTR SVQLAAATRT GGVVWAFDAA 
GDYRLTLAAS AGLHSGKTVS AEATYRIRVP AIMPPGQMLP SAAPQQTTRP DGHPTVQTFA 
APAAEPKLAA EPKPAAEPKP AAAPAAPAAR VAAATSKGVR HVIADGHVDM GPQLSGDTWT 
IRIKDDRSSP AVWRETADVV LHIKDNAKIT VPAGADFLGR QGDTVWLLPQ SQQAGIVWPG 
WNTQHQSVVS GVKGNVTWTL RGVNGPGRFA LFLTGSFGKA DVLFDSAKSF PQQLAVPLNT 
HAHGNWAFTK PGLYRLAVQM SGTTTAGKAV TDTKTLTIAV GDSTDPTVGF GPGSASEGGG 
ENNGKDQGGT GPLPRTGVGW VLSAGAAGMG LVAAGVLLVL LARRRCTGPA DRAVGNQ