Gene Slin_3958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_3958
Symbol
ID	8727716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	4749880
End bp	4750968
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	59%
IMG OID
Product	peptidase M19 renal dipeptidase
Protein accession	YP_003388747
Protein GI	284038817
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.561135
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCATTA TTGATGCCCA CCTCGACATG GCCCTCAACG CCATCGAATG GAATCGCGAT 
TACCGCCTGT CAGCCCACCA GATCCGCGAA CTGGAAGCCG ATATGACCGA CAAAATTGAC 
CGGGCAAAAG GCACCGTCTC TCTTCCCGAC CTCCGCCGGG GTAATATCGG TCTGGTCGTG 
GCGACGCAGA TTGCCCGGTT CAACCAAAGC AACGGAAACC TGCCCGGCGC GGGCTGGAAC 
TCCCCTGAAC AGGCCTGGGC CATGACGCAG GCACAGCGGA CGTGGTACGA AACGATGGTC 
GACGCGGGCG AAATGGTGCA GATCACCGAC CGGACCAGCC TCGATAGCCA CGTGGCGCTC 
TGGCTCGACG AAAGTATTCC CAACGACACC AAACCCGTCG GGTATATCCT CAGTCTGGAG 
GGGGCCGACT CGCTGGTGAA CCTGTCGTAC CTGGAGAAAG CGTATAATTA CGGCTTACGC 
GCCCTCGGTC CGGCGCACTA CAGCACGGGC CGTTATGCCC CCGGCACCGG CCTGAATGGT 
CCGCTGACGG CGCAGGGCCG CGAGCTAGTG AAAGAAATGG ACCGGCTGGG CATTATTTTA 
GATGCAACCC ACCTCACCGA CGAAGGATTT ACGGAAGCCC TGTCTTTGTA CAAGGGACCC 
GTATGGGCGA GTCACCACAA TTGTCGGGCG CTGGTGCCGC ACCAACGGCA GCTCACCGAC 
GATCAGATCA GGCAGTTGAC GGATCGGGGC GGGGTTATCG GCGGGTGTTT CGATGCCTGG 
ATGATGAAGC CCGGTTTCAC CCAGCGCGTC AGCAATCCGA CCGAATTTGG CATTAGTATC 
GAAACAATCA TCGACCACTA CGACCACATT TGCCAGCTCA CCGGCAGCAG CCAGCACATC 
GCCATCGGCA GTGATCTCGA CGGCACCTAC GGCATCGAAC AATCGCCCAG TGACCTCGAC 
ACCATCGCCG ACCTGCAAAG CCTGACCGGT TTACTAACGA AACGCGGCTA CACCCAGGAG 
GATATTGAAA ATATTTTCCA CAAAAACTGG CTGCGGTTTC TGCGAGGGGC GTGGTCCCCA 
GGCACCTAA

Protein sequence

MFIIDAHLDM ALNAIEWNRD YRLSAHQIRE LEADMTDKID RAKGTVSLPD LRRGNIGLVV 
ATQIARFNQS NGNLPGAGWN SPEQAWAMTQ AQRTWYETMV DAGEMVQITD RTSLDSHVAL 
WLDESIPNDT KPVGYILSLE GADSLVNLSY LEKAYNYGLR ALGPAHYSTG RYAPGTGLNG 
PLTAQGRELV KEMDRLGIIL DATHLTDEGF TEALSLYKGP VWASHHNCRA LVPHQRQLTD 
DQIRQLTDRG GVIGGCFDAW MMKPGFTQRV SNPTEFGISI ETIIDHYDHI CQLTGSSQHI 
AIGSDLDGTY GIEQSPSDLD TIADLQSLTG LLTKRGYTQE DIENIFHKNW LRFLRGAWSP 
GT