Gene Sare_4466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4466
Symbol
ID	5708341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5046885
End bp	5048105
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	72%
IMG OID	641273882
Product	cell wall anchor domain-containing protein
Protein accession	YP_001539231
Protein GI	159039978
COG category
COG ID
TIGRFAM ID	[TIGR01167] LPXTG-motif cell wall anchor domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.137479
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCCGT TCCACCGTCC GTCGCTGGCC CGTGCCGGGG CGCTCGCCCT GCTCGTAGCG 
GCCGGCAGCA CCGGCGTGTC CGCTCCGGCG CACGCTGCCG GCGAAGCCGA CCTGGCGTTG 
ATCCCGCTCA GTTCCGAGCT GGCCAAGGGT GTCGAGGAGG CCAAGGCCAA GCCGTTCAAA 
TTTCAGGTCA ACAACACCCG CAGCACGGTC GACGCGAAGG CCGTTCAGGT GACCGTCGAA 
ACGGCGCACC TCAACGACCG CAAGGTCGGC GTGGTGGTGC CCGACGGCTG TGAGGCCACC 
GGGACCACGT TCAGCTGCCT CCTCGGCGAC CTACCCGCGG GCACCACCGA GGACTTCGGC 
ATCCCACTGT TCTCCCTGGG CAAGCGCGGG GACGCCGGGC ACCTGGTCGT CACCGTGACC 
TCGGCCACCA CCGACCCGTT CATGGAGGAC AACACCGTCG AGCACGACAT CACCGTCGCC 
AAACCCGGCC ACGACCTCAC CACCTGGGTG CAGGACGTGT ACGCCGACGT GGAGGTCGAC 
GGCGACGACC GTGGTGAGCA GGCACTGTTG CCGGTGCGGC CGGGCGAGAC CGCGCCGCTG 
GACTGGGCCG TGTACAACCA CGGCAGCCGT GCGGCCACCG GCATCGCGTA CGGGATCGCC 
CTGCCGGCCG GTGTGACCTT CGCCGAGCTG CCGGAGGGCT GCGACGAGTC GGATGGCGAG 
GGCCCGGCGC TGGCGCACTG CGCGGACTCC GGCGCGGTGC TGCGCCCCGG CGAGTTCTAC 
ACCGCCGACG TGCGGGTGCG GGTGGACGCC GACGTGACCG AGCCGGTGCT CCGCCCGGGC 
TTCCTCTACG GCTTCGGCCT TGACGTCGTG GCCGGCGAGC CGGAGGCGAC GCCGCGAATC 
GCCTCCGACA CCCAGCGCCG GACCTTCGCC GATGTCGATC CCGGCGACGA TTGGGCCCAG 
TTCGACGTGT TCGTCGACCT CTCCCCGGTC AGCACCCCGA CCCCCACGCC CACCGGGGAA 
CCGACCGGTT CGCCGAGCCC GACCGCCACC GCGACCCCGG GCGGGTCCGG TGGTGGCGGC 
CTGCCGGTCA CCGGTGTGCA GGCCGGCCTG ATCGGCGGCA TCGGCGCGGC CGTGCTGCTG 
GCCGGCGGTG TCCTGCTGCT GCTCTCGCGG CGGCGGAAGG TCGTCCTGGT GAACCCGGCC 
GACGAGCGGA CCATCGACTG A

Protein sequence

MIPFHRPSLA RAGALALLVA AGSTGVSAPA HAAGEADLAL IPLSSELAKG VEEAKAKPFK 
FQVNNTRSTV DAKAVQVTVE TAHLNDRKVG VVVPDGCEAT GTTFSCLLGD LPAGTTEDFG 
IPLFSLGKRG DAGHLVVTVT SATTDPFMED NTVEHDITVA KPGHDLTTWV QDVYADVEVD 
GDDRGEQALL PVRPGETAPL DWAVYNHGSR AATGIAYGIA LPAGVTFAEL PEGCDESDGE 
GPALAHCADS GAVLRPGEFY TADVRVRVDA DVTEPVLRPG FLYGFGLDVV AGEPEATPRI 
ASDTQRRTFA DVDPGDDWAQ FDVFVDLSPV STPTPTPTGE PTGSPSPTAT ATPGGSGGGG 
LPVTGVQAGL IGGIGAAVLL AGGVLLLLSR RRKVVLVNPA DERTID