Gene Sare_1887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1887
Symbol
ID	5704189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2172925
End bp	2174136
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	70%
IMG OID	641271388
Product	argininosuccinate synthase
Protein accession	YP_001536763
Protein GI	159037510
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0116306
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0366285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAGC GGGTCGTTCT GGCGTACTCC GGAGGGCTGG ACACCTCCGT CGCGATCCCG 
TACCTGGCCG AGCAGACCGG CGCCGAGGTG ATCGCCGTGG CGGTCGACGT CGGGCAGGGT 
GGTGAGGACC TGGACGCGAT TCGGCAGCGG GCCCTGGACT GTGGGGCGGT GGAGTCCGAG 
GTGGTCGACG CGCGCGACGA GTTCGCCGCC GAGTACTGCC TGCCCGCGGT CCGCGCCAAC 
TCCCTCTACA TGGACCGGTA TCCGCTGGTC TCCGCACTGT CCCGGCCACT GATCGTCAAG 
CACCTGGTGG CCGCGGCCCG CACCCACGGC GGCACCATCG TGTCGCACGG GTGCACGGGG 
AAGGGCAACG ACCAGGTGCG CTTCGAGGCC GGCCTCGGGG CGCTCGCCCC GGATCTGCGG 
ATCGTCGCGC CGGCCCGGGA CTTCGCCTGG ACCCGGGACA AGGCGATCGC GTTCGCCGAG 
GAGAAGGGCC TGCCCATCGA TGTGACGGCG AAGTCGCCCT ACTCGATCGA CCAGAACCTG 
TGGGGCCGTG CCGTCGAGAC CGGCTTCCTG GAGGACATCT GGAACCCGCC GATCGAGGAC 
CTGTACGCCT ACACCGCCGA CCCGGCCGAA CCGCGGGACG CGGACGAGGT CGTCATCACC 
TTCGACGCCG GGAACCCGGT CGCCATCGAC GGTGAGACCG TCACCCCGTA CCAGGCGATC 
GTGGAGCTGA ACCGGCGTGC CGGCGCGCAG GGCGTCGGCC GGCTGGACAT GGTCGAGGAC 
CGGCTCGTCG GCATCAAGAG CCGCGAGGTG TACGAGGCTC CGGGCGCGAT CGCGCTGATC 
GCCGCACACC AGGAGTTGGA GGCGGTCACC GTCGAGCGGG ATCTCGCCCG GTTCAAGCGG 
GGCGTGGACC AGCGCTGGGG TGAGCTGGTC TACGACGGCC TGTGGTTTTC TCCGCTGAGG 
GCTGCGTTGG ACGCCTTTGT CAACGATGCG CAGCAGCACG TTTCCGGCGA TGTGCGGCTC 
ACCCTGCACG GCGGGCGGGC CACCGTGACC GGCCGGCGGT CCGAGGCCAG CCTGTACGAC 
TTCGGCCTGG CCACCTACGA CACCGGTGAC ACCTTCGACC AGTCCCTGGC CAAGGGATTC 
GTGCAGCTGT GGGGCCTGCC CAGCAAGATG TCGGCGGCAC GGGACGCCCG GCTGGGTGGG 
GCGCAGTCGT GA

Protein sequence

MTERVVLAYS GGLDTSVAIP YLAEQTGAEV IAVAVDVGQG GEDLDAIRQR ALDCGAVESE 
VVDARDEFAA EYCLPAVRAN SLYMDRYPLV SALSRPLIVK HLVAAARTHG GTIVSHGCTG 
KGNDQVRFEA GLGALAPDLR IVAPARDFAW TRDKAIAFAE EKGLPIDVTA KSPYSIDQNL 
WGRAVETGFL EDIWNPPIED LYAYTADPAE PRDADEVVIT FDAGNPVAID GETVTPYQAI 
VELNRRAGAQ GVGRLDMVED RLVGIKSREV YEAPGAIALI AAHQELEAVT VERDLARFKR 
GVDQRWGELV YDGLWFSPLR AALDAFVNDA QQHVSGDVRL TLHGGRATVT GRRSEASLYD 
FGLATYDTGD TFDQSLAKGF VQLWGLPSKM SAARDARLGG AQS