Gene Sare_4394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4394
Symbol
ID	5706102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4965779
End bp	4966888
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	67%
IMG OID	641273812
Product	protein-L-isoaspartate(D-aspartate) O-methyltransferase
Protein accession	YP_001539162
Protein GI	159039909
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2518] Protein-L-isoaspartate carboxylmethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.138918
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00918813
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCGACC CGACGGCAGG GCCACGGCAC GAGCTGGCCG CCAAACTCAC CACCGCCGGC 
GCCCTCGGAT CACCGGCATG GATTTCAGCG TTCGAACAGG TACCGCGGCA CCTGTTCGTC 
CCCGCCTGCT GGCACCGCAT CGCCGCCGGC CTGGAGTATC TCGACAGCGC GAACCCCGAG 
CAGCGCGACC ACTGGCTAGC TGTCTGCTAC TCCGATACCT CCCTGGTGAC CCAGGTCGAC 
TCCTCGGGGA CCGCCACCAG CGCATCCAGC CAACCGTCCG TCATGGCCAT CATGCTCGAA 
GCGCTCGACG TCGCCGCGGA CAATACTGTC TTGGAGGTCG GCACCGGCAC CGGATACAAC 
GCCGCGCTGC TGTGCCACCG TCTCGGCGAT GACCGGGTGC ATACGGTCGA GTACGACCAG 
GCCCTGTCCA CCACCGCCAC CGCCGCTCTT GCGCAGGCCG GCTATCACCC CGCGATGCGG 
GTAGGTGACG GCGCGGCAGG CTGGCCCGAG CAGGCACCAT ACGACCGGAT CATCGCCACC 
TACGGCACCG AGCGAATCCC GCCGACCTGG CTGCGCCAGT GCACACCAGG GGGCGTCATC 
GTCGCCAACC TCGGCCTCGG AGTGATCGCC CTGCACGTCG ACCAGCATGG CCACACGGGC 
TCAGGCCGTT TCCTGTCCCG AGCGGCCTTC ATGAACTCCC GCGCCGGCGG CGATGCGGCG 
ACGGTCCCGC AGGCCGCGTT CGACCCCGCA ATCGTGGGCC TCGGACACCC AGCAGACACA 
CCACCGGACT TGAGGGACGA CAACTTCACG GCCTGGCTAC ACTTGCACAG CCCGGAAATC 
GTGCAGGTCA CTCTCCCCGG CCCGGACGAC TCACTCAGCC AAGCGGAACA CATTTTCGCC 
AATCGCGCGG GCTCCTGGGC GAGAGTCGGC AACGGGCGGA TAACGCAGGT AGGGCCAATC 
TGGCGAGACG TACACGACGC ACACACACGC TGGGCGCACG CCGGTCGTCC CGAGGTGGAA 
CAGATCGGAC TGACCGTCCG CGACGACGGT CACCACACGC TATGGGTGGA CAACCCGTCC 
AGCACACAGC GATGGAATCT CACCCCATGA

Protein sequence

MTDPTAGPRH ELAAKLTTAG ALGSPAWISA FEQVPRHLFV PACWHRIAAG LEYLDSANPE 
QRDHWLAVCY SDTSLVTQVD SSGTATSASS QPSVMAIMLE ALDVAADNTV LEVGTGTGYN 
AALLCHRLGD DRVHTVEYDQ ALSTTATAAL AQAGYHPAMR VGDGAAGWPE QAPYDRIIAT 
YGTERIPPTW LRQCTPGGVI VANLGLGVIA LHVDQHGHTG SGRFLSRAAF MNSRAGGDAA 
TVPQAAFDPA IVGLGHPADT PPDLRDDNFT AWLHLHSPEI VQVTLPGPDD SLSQAEHIFA 
NRAGSWARVG NGRITQVGPI WRDVHDAHTR WAHAGRPEVE QIGLTVRDDG HHTLWVDNPS 
STQRWNLTP