Gene Dole_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1971
Symbol
ID	5694811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2382589
End bp	2383632
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	56%
IMG OID	641264569
Product	glycosyl transferase family protein
Protein accession	YP_001529852
Protein GI	158521982
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAACA TCCGGCTGCT CGGCATGGTC GTGGGTCTTG CGCTTTTTCT CTTAAGCTTT 
CGTATCTTCC GCGGCCAGAA GTGGAACCGG GCCAATTTTT TCCTGTTTGC CGGGTCCGGC 
CTGTTTCTTT TTGCTCTTTC CCTCAATCCC GGCCTGATAA ACATTTTACA GCGCATGCTG 
GCCCTGGATG ATGCGGAACG GGGCCGGTTG ATGGCCCTGC TGATTTTTGC CGTTGGAGTG 
CTCTGGTTTG CCCTCATTCT GATGCGCACC TCCTTTCTGA AACACAAGTA CCAGTTTGAC 
CGGTTTGTGC GGGCCGTGGG CATCGCAAAT TACATTGAAA AAATTCGAAC CGACCTTGCC 
GGATGTGACG TGGCGGTTCT TATTCCGGCC TATAATGAGG CAGACAACCT GCGGGCGGTC 
CTGCCCCGTA TCCCCAAAGA GGTGGGCGGG CTGAAGCTGG GGGTGGTGGT GGTGGACGAC 
GGCAGCGACG ACGGCACCTG TGAGTGCGCG ATTGCTGCCG GGGCCTTTGC GGTTCGCAGC 
CCCATCAATC GGGGCGGGGG CGCGGCCCTG CGGCTGGGAT ATGATATCCT GCAAAAGGCG 
GATATCGACA TCTGCGTCAC CATGGATGCC GACGGCCAGC ATAACCCCGA GGAGATTCCC 
GCACTGCTTT CCCCGCTGCT GGAAGAACAA TGCGATATTG TTATCGGCTC CCGCATTCTC 
GGGTCCAGGG AAAAGGACAG TCTGTTCAGG CTGGCAGGGG TCTATTTTTT CAGCTTTATC 
ATCAACCGGC TCACCGGCCT TAATATCACC GACCCGTCCA GCGGGTTCCG GGCCTTTAAA 
ATGGACGTGG TCCGGCGCGT CCCCTTGGAC GAGGACCAGT TTCACACCAG CGAGCTGATC 
ATCAACGCGG CCAAGGGCGG TTTTTGCATT CGCGAGGCCC CCATCACCAT TCTTCGACGA 
AAATACGGTG AAAGCAAAAA AGGCAGAAAC TGGCTGTACG GCCTCAATTT CGCAAAAATT 
GTTGTTCGAA GCTGGTGGAG ATAG

Protein sequence

MSNIRLLGMV VGLALFLLSF RIFRGQKWNR ANFFLFAGSG LFLFALSLNP GLINILQRML 
ALDDAERGRL MALLIFAVGV LWFALILMRT SFLKHKYQFD RFVRAVGIAN YIEKIRTDLA 
GCDVAVLIPA YNEADNLRAV LPRIPKEVGG LKLGVVVVDD GSDDGTCECA IAAGAFAVRS 
PINRGGGAAL RLGYDILQKA DIDICVTMDA DGQHNPEEIP ALLSPLLEEQ CDIVIGSRIL 
GSREKDSLFR LAGVYFFSFI INRLTGLNIT DPSSGFRAFK MDVVRRVPLD EDQFHTSELI 
INAAKGGFCI REAPITILRR KYGESKKGRN WLYGLNFAKI VVRSWWR