Gene Strop_1108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1108
Symbol
ID	5057555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	1253187
End bp	1254545
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	76%
IMG OID	640473375
Product	N-formimino-L-glutamate deiminase
Protein accession	YP_001157957
Protein GI	145593660
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02022] formiminoglutamate deiminase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCGCT GGCTCGCCGA GTACGCGTGG CTCCCCGAGC AGCCCGAGCC GACCCCGGAC 
GTGCTGATCG AGACCGCTGC CGGCCGGATC ACCGGGGTGA CCCCGCTCGC GCCCGAAAGC 
CGGCCGACCA CCGGGATCGA GGTCCTCGCC GACGCGGTCC GCCTGCCCGG GCTGACCCTG 
CCGGGGCTGG CCAACGCGCA CTCGCACGCC TTCCACCGCG CGTTGCGCGG CCGCACCCAC 
GGCGGTCGCG GCGACTTCTG GACCTGGCGG GACCGAATGT ACGAGGTGGC CGCCCGGCTG 
GACCCGGAGA GCTACCTCGC GCTCGCCCGC GCCGGGTACG CGGAGATGGC GCTGGCCGGC 
GTCACCTGCG TCGGCGAGTT CCACTACCTG CACCACGGCC CGGACGGCAC CCCGTACGCG 
GACCCGAACG CGATGGGGGC CGCCCTGGTC GAGGCGGCAG CGCACGCCGG GATCCGGCTG 
ACCCTGCTGG ACGCCTGCTA CCTGACCGCC ACCGTCACCG GCGATCCGCT GGCCGGGCCG 
CAGCGACGCT TCGGCGACGG TGACGCCCTG CGCTGGGCGG AGCGGGCGGC GGCGTTCGCC 
CCCACCGAGG CGCACGTACG GGTCGGCGCG GCGATCCACT CGGTACGCGC CGTGCCCGCC 
GACCAACTGG CGACGGTGGC CGGCTCGGCG CAGGAGCGGG GCGTCCCGCT GCACGTGCAC 
CTCTCCGAGC AGCCGGCCGA GAACGACGCC TGCCGGGCCG CGCACGGCTG CACCCCCACC 
CGCCTGCTGG CCGACCGGGG CGTCCTCGAC CAGCACACCA CCGCCGTGCA CGCCACCCAC 
CCCACCAGCT CGGACGTGGC CCTGCTCGGG GAGAGCAACA CCGGGGTCTG TCTCTGCCCC 
ACCACCGAGC GGGACCTCGC CGACGGGATC GGACCGGCCC GCCGGATGGC CAACGCCGGC 
ACCCCGCTGA GCCTCGGCAG CGACAGCCAC GCGGTGGTGG ACCTTTTCGA GGAGGCGCGC 
GCGGTGGAGC TGGATGAGCG CCTGCGCACC CGGCAACGCG GCCACTTCAC CGCCGGCGAG 
CTGGTCACCG CGGCCACCGT CGCCGGGCAC GTCGCCCTCG GCTGGGGCGA CGCCGGCCGG 
CTGGCCGTCG GCGACCGGGC CGACCTGGTC ACCCTCCGGC TGGACAGCCC GCGGACCGCG 
GGCGTACCGG CAGCCGGCGC GTTCTTCGCC GCCACCGCGG CGGATGTCCG CCAGGTGGTG 
GTGGACGGCC AGGTGGTGGT CCAGGACGGA CTGCACTGCA CCGTCGACGT CCCCACCGAG 
CTGGCCACGT CGATCGCGGA GGTGACCGGT ACGCCATGA

Protein sequence

MTRWLAEYAW LPEQPEPTPD VLIETAAGRI TGVTPLAPES RPTTGIEVLA DAVRLPGLTL 
PGLANAHSHA FHRALRGRTH GGRGDFWTWR DRMYEVAARL DPESYLALAR AGYAEMALAG 
VTCVGEFHYL HHGPDGTPYA DPNAMGAALV EAAAHAGIRL TLLDACYLTA TVTGDPLAGP 
QRRFGDGDAL RWAERAAAFA PTEAHVRVGA AIHSVRAVPA DQLATVAGSA QERGVPLHVH 
LSEQPAENDA CRAAHGCTPT RLLADRGVLD QHTTAVHATH PTSSDVALLG ESNTGVCLCP 
TTERDLADGI GPARRMANAG TPLSLGSDSH AVVDLFEEAR AVELDERLRT RQRGHFTAGE 
LVTAATVAGH VALGWGDAGR LAVGDRADLV TLRLDSPRTA GVPAAGAFFA ATAADVRQVV 
VDGQVVVQDG LHCTVDVPTE LATSIAEVTG TP