Gene Sare_2336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2336
Symbol
ID	5707964
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2688195
End bp	2689268
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	66%
IMG OID	641271814
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001537185
Protein GI	159037932
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.930883
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.268504
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGATCC TGGTCACCGG CGGTGCCGGC TTTATCGGCT CACACTATGT CCGGTCCCTG 
TTGGCTGGTG AGTACGCTGC GGAGGACGCT GTCGGAGCGG TGGACGCCTC CGTCACTGTC 
CTGGACAAAC TCACCTACGC CGGCAATCGC GCCAACCTGC CGGCCACCCA CCCACGCCTG 
ACCTTCGTGC AGGGTGACAT CTGCGACCAG GGACTGCTGC GGGACCTGTT CAAGGGCCAT 
GACGCGATTC TGCACTTCGC CGCTGAGTCA CACGTGGATC GGTCGGTCGA CGGTGGAGCA 
ACCTTCGTAC GCACCAATGC GTTGGGAACC CAGTCGGTGC TGGAAGCCGC TGTCGCGGTC 
GGCGTACCGC GGGTCGTACA CGTCTCGACC GACGAGGTCT ATGGCTCCAT CGAACACGGG 
GCGTGGACCG AGACGTGGCC GCTGCTGCCG AACTCCCCGT ATGCGGCTTC CAAGGCGAGC 
GCGGACCTCA TCGCCCGTTC CTACTGGCGA ACCCATGGCC TGGACGTTTC GATCACCCGC 
TGTTCCAACA ACTACGGGCC CTACCAGCAT CCGGAAAAGC TCGTCCCGCT GTTCATCACC 
AACCTGCTCG AGGGATTGCC GGTGCCCGTG TACGGCACCG GGGTGAACGT GCGGGAGTGG 
CTGCACGTGG CCGACCACTG CCGCGCACTC CACCGGGTAC TCACCCGAGG GCGTCCCGGT 
GAGGTCTACA ACGTGGGCAG CGGAAACGAG TTGACGAACC TGGAGCTGAC CGAGCGCCTG 
CTCCACCTGT GCGGCGCGGA CCGCTCCATG ATCCGTTACG TCACCGACCG CAAGGGGCAC 
GACCAGCGGT ACTCCCTTGA CGACACCAAG ATCCGCGAGT GTCTCGGTTA CCGGCCCCGC 
GTCTCCTTCG CCGATGGGCT GGCCGAAACC GTCGCCTGGT ACCGCGACAA CCCACAGTGG 
TGGAAGGCGG CCAGGCACGG CGCTCCCAAG ACCACCGAGG CCGCGCCTCG GGCGACCACC 
GGAGTGGTCC GTGGAACGCA CAACCGTATC GACGACCAGG AGCCACCAAA ATGA

Protein sequence

MRILVTGGAG FIGSHYVRSL LAGEYAAEDA VGAVDASVTV LDKLTYAGNR ANLPATHPRL 
TFVQGDICDQ GLLRDLFKGH DAILHFAAES HVDRSVDGGA TFVRTNALGT QSVLEAAVAV 
GVPRVVHVST DEVYGSIEHG AWTETWPLLP NSPYAASKAS ADLIARSYWR THGLDVSITR 
CSNNYGPYQH PEKLVPLFIT NLLEGLPVPV YGTGVNVREW LHVADHCRAL HRVLTRGRPG 
EVYNVGSGNE LTNLELTERL LHLCGADRSM IRYVTDRKGH DQRYSLDDTK IRECLGYRPR 
VSFADGLAET VAWYRDNPQW WKAARHGAPK TTEAAPRATT GVVRGTHNRI DDQEPPK