Gene Sare_5027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_5027
Symbol
ID	5705164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5696464
End bp	5697774
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	71%
IMG OID	641274420
Product	arginine deiminase
Protein accession	YP_001539761
Protein GI	159040508
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0721497
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGACCC ACTACGTGGA CAGTGAGGTT GGTCGCCTCG GCACGGTCAT GTTGCACCGC 
CCGGGGCCGG AGTTGGCCCG GCTCACCCCC CGGAACAACG ACTCGCTGCT CTTCGATGCC 
ATCCCATGGG TCGGCCGGGC GCAGGAGGAG CACGACGCCT TTGCCGCCGC CCTGCGCGAA 
CGCGGCGTCG AGGTGCTCCA CCTGGCGGAG CTGCTCACCG AGACACTCGC CGCCAGCGAC 
GCCCGGGCGG AGCTGACCGA GCAGGTGCTG CGTTCGCCCC GGCTCGGCGA CCAACTGCGG 
GCCCGCGTCG CCGACCATCT CGCGTACCTC GACCCGGCCA CACTGGCCGG CGTCCTCATC 
GCCGGTCTGG CCCACGAGGA ACTGCGGATC AGCCGGGAGC GCCCCGGTGG TCTGGTCTAC 
ACGCTGATGG ACCGGCACGA GTTCGTCATC GACCCGCTGC CGAACCTGCT CTTCACCCGC 
GACTCGTCCG TCTGGATCGG CGGTCGGGCC GCGGTCACGA GCCTGGCCAT GCCCGCCCGC 
CGGCGGGAGA GCACCCTGAC CGACGCCATC TACCGCCACC ATCCGCGGTT TGCGGGCACC 
GAGTTCGTGT ACCACCCGAC GATGGAGCAT CTGGAGGGCG GCGACGTGCT GCTGCTCGCC 
CCCGGCGTGC TGGCGGTCGG GGTGGGCGAG CGGACTACCC CGGCGGGTGC CGAGCGCCTT 
GCCCGCCAGG TCCTTGCCGC GCAACTGGCA CACACCATCC TGGTCGTGCC GATCGTGCAG 
GAACGGGCCA CCATGCACCT CGACACCATC TGCACGATGG TCGACGTCGA CGCGGTGCTG 
ATGTACGCGA ATGTCGCCAG CACCCTCGTC GCGTATACGG TGGCCGCCAG GGCGGACGGT 
GAGGACCCGA GGATGGACGG GCCGGTGCCG TTTCTGCGGG CCGCCGCGGA CGCGATGGAC 
CTGGACCAGC TCCGAGTGAT CGACACCGGT CTGGATCCGG TGACCGCCGA GCGTGAACAG 
TGGGACGACG GCAACAACAC CCTTGCCCTG GCACCCCGGC TCTGCGTCGG CTACGAGCGG 
AACACGGAGA CCAACGCCCA GCTGGAACGG GCCGGCATAG AGGTGGTCGC GATCGCCGGT 
TCGGAACTGG GCTCCGGCCG CGGAGGCCCC CGGTGCATGT CCTGCCCGCT GCTCCGCGCC 
CCCCTCGGCG GGGACGCGGA GCAGGCCGCG GCGAGCTCGG TCGCGTCGCC GTACCGGGCG 
CCACGCGCTG GTAGGAAAGG AGCTGGGCCG GTGGGGTTCA GCGGAGGGTG A

Protein sequence

MVTHYVDSEV GRLGTVMLHR PGPELARLTP RNNDSLLFDA IPWVGRAQEE HDAFAAALRE 
RGVEVLHLAE LLTETLAASD ARAELTEQVL RSPRLGDQLR ARVADHLAYL DPATLAGVLI 
AGLAHEELRI SRERPGGLVY TLMDRHEFVI DPLPNLLFTR DSSVWIGGRA AVTSLAMPAR 
RRESTLTDAI YRHHPRFAGT EFVYHPTMEH LEGGDVLLLA PGVLAVGVGE RTTPAGAERL 
ARQVLAAQLA HTILVVPIVQ ERATMHLDTI CTMVDVDAVL MYANVASTLV AYTVAARADG 
EDPRMDGPVP FLRAAADAMD LDQLRVIDTG LDPVTAEREQ WDDGNNTLAL APRLCVGYER 
NTETNAQLER AGIEVVAIAG SELGSGRGGP RCMSCPLLRA PLGGDAEQAA ASSVASPYRA 
PRAGRKGAGP VGFSGG