Gene Dshi_1173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1173
Symbol
ID	5711941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	1205414
End bp	1206421
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	69%
IMG OID	641267084
Product	NMT1/THI5 like domain protein
Protein accession	YP_001532516
Protein GI	159043722
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0956705
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACGAT CCACATCTTC GCCCCGCCTC AGCCGCCGGG CCGCCCTGCA ACTGGGGGGC 
GCCGCGTTGG CCGCCCCGTT CATGGCCCGC CCCGCCCGGG CCGCGACCAC CAGGCTCACT 
TTTCAGCTCG ACTGGAAGAT CAACGCCCAA TTCGCCGGGC TCTTCATGGC CGAGGCCGAG 
GGACTCTATG CCGATGCGGG CCTGGAGGTC GAGATCCGCC CCTGGGCCGA CGGGGTCAAT 
GTCGCCTCCG AAGTGGCCGA GGGCCGCGCC CACATGGCCT GCGCCGAGCA GAATCTGATC 
CTCGGCGCCC AGGCCGCGGG TGCACCGATC AAGGCCGCCG CGACCATGTT CCAGGCCTCG 
CCCTACGGGC TGATGGCCCC GGCGGGGGCG GGCCTGAGCG GGCTGGAGGC GCTGCGGGGC 
AAGACCGTGG GTGTCCATGT GGACGGGCTG AAGGTCATGG CGTTGGTCAA GGGGGTGAAC 
GGGATCGAGG AAATCGAAGT GGTCGAGATC CCCTATGCCG ACAAGTTTGC GCGTGCGGTC 
TCGGGCGAGA TGTTCGCGGT CCAGTGCTAT GTCATCGACG AGCCGATCGG CGTGACCGCG 
CGATACGGTG CCGCGCCCGA GGTGCTGAAG CTGTCCGATC ACGGGCTGTT GTCGACGGCC 
CAGACGATCA TGGCCTCCGA CACGCTGCTG ACCGAGCAGC CGGAGGTGGT CGAGGCCTTC 
CTCGCCGCCA CGTTCGAGGG CTGGGCACGG GTGCTGGCCG ACAAGCCCGC CGCGGCCGAA 
ATGGTCGTGG GCCAGTTCGT GCCCGACGGC TCGGTCTACA AGGACGTGGC GTATCAGACC 
CGCTGCCTGG AGCTGCTGGA ACCATATGTC ACCGGCGGGA CCGACGATAT CGGCGTGATC 
TCCCGGCAGA AGTGGGAAGA GGCCGCCACC CGCATGGCCG AATACGGCAT CGTCGAGGCG 
CTGCCGGACC TGTCCACCAC GCTCGCCGAC ACCGCCTTCG TGGCGTGA

Protein sequence

MPRSTSSPRL SRRAALQLGG AALAAPFMAR PARAATTRLT FQLDWKINAQ FAGLFMAEAE 
GLYADAGLEV EIRPWADGVN VASEVAEGRA HMACAEQNLI LGAQAAGAPI KAAATMFQAS 
PYGLMAPAGA GLSGLEALRG KTVGVHVDGL KVMALVKGVN GIEEIEVVEI PYADKFARAV 
SGEMFAVQCY VIDEPIGVTA RYGAAPEVLK LSDHGLLSTA QTIMASDTLL TEQPEVVEAF 
LAATFEGWAR VLADKPAAAE MVVGQFVPDG SVYKDVAYQT RCLELLEPYV TGGTDDIGVI 
SRQKWEEAAT RMAEYGIVEA LPDLSTTLAD TAFVA