Gene Dshi_4165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_4165
Symbol
ID	5714680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009959
Strand	-
Start bp	13135
End bp	14130
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	70%
IMG OID	641277060
Product	NMT1/THI5-like domain-containing protein
Protein accession	YP_001542356
Protein GI	159046688
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0994431
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAAGA CCCTCACACG ACGGACCGTC CTCGGCAGCG CCGCCGCCGC CGCGGGCGCG 
ACCGCCCTGG GCGCCTTGCC CCACCGCGCC CGGGCCCAAT CGGCGGTGAG CCTGCAACTG 
AGCTGGCTGC ATTCGTCGCA ATTCGCGGGC AGCTACATCG CGCTCGACCG CGGCTGGTGG 
GCCGAGGCCG GGCTGGAGGT CTCGCTGCTG CCGGGCGGGC CGAACGCGCC GGTGGAGCCG 
CCAGTGGTCG CGGGCACGGC ACTGGTGGGC ATCTCGGCGG CCGATTACAC CGCTGCGGCC 
GTGGAACAGG GCGCGCCCTT CAAGATCCTC GGCGTGGCGA TGCAGAAGAA CCCCTTTGTC 
GTCGCCTCCC TGCCCGCCAA CCCGGTGAAC GAGCCTGCCG ACCTGGTGGG CAAGCGGATC 
GGCATGGCGC TGGCCAACAC GCCCGTGTTG CAGGCGCTCT GCACCCTGAA CGGGGTGGAC 
ATGGGCGGCA TCGACATCGT GCCGACCCAG TACTCCGCCC AGCCCCTGCT GGCGGGCGAG 
GTGGACTGCC TGCTCTGCTG GGAGACCGAT CTGCCCGTCG CCATGGCGAT GCAGGGGGTC 
GAGAGCCTGA CCATGCTGAT GGCCGATCAC GGCTATGCGG TGCATTCCCA GACCTATATC 
GCCACCGAGG ACAGCCTTGC CAATCGCCGG GCGGACCTGG TCGCCCTGAT GTCCGGGGAG 
GCGCGCGGCT GGGACGCCTA CCGCGCCGAT ACCGATGCGG CGGCCGAGCT GACCCTGTCG 
ATGTACCCCG ATGCAGGCCT CGACCTGGAG ACCCAGAAGC TGCAGGCGGC GCGGCAGGTG 
CCGCTGATGT TCTCGGAGCT GACCGACGCC AACGGCTTCG GCTGGTGGAC CGACGAGACG 
GTGGCCGCCA ATATCGAAAC CCTCGCCCTG CTGGGCCGGA CGGTGACGCC GGACCTGTGG 
GACCGCTCGA TCCTCGAAGA GGTCCATGGC GCCTGA

Protein sequence

MPKTLTRRTV LGSAAAAAGA TALGALPHRA RAQSAVSLQL SWLHSSQFAG SYIALDRGWW 
AEAGLEVSLL PGGPNAPVEP PVVAGTALVG ISAADYTAAA VEQGAPFKIL GVAMQKNPFV 
VASLPANPVN EPADLVGKRI GMALANTPVL QALCTLNGVD MGGIDIVPTQ YSAQPLLAGE 
VDCLLCWETD LPVAMAMQGV ESLTMLMADH GYAVHSQTYI ATEDSLANRR ADLVALMSGE 
ARGWDAYRAD TDAAAELTLS MYPDAGLDLE TQKLQAARQV PLMFSELTDA NGFGWWTDET 
VAANIETLAL LGRTVTPDLW DRSILEEVHG A