Gene Dole_1802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1802
Symbol
ID	5694642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2182717
End bp	2183832
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	55%
IMG OID	641264400
Product	glycosyl transferase group 1
Protein accession	YP_001529683
Protein GI	158521813
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGACTA AACCCCATAT CTGTTTTGTG GCACCAATGG CATGGCCCGT CCTTTGCGAG 
GTTCCGGGCT TGCAGGCCAT TGGAGGGGCC GAACTTCAGC AGGTGCTGCT GGCCAGGGAG 
CTGGCGCACC GGGGTTACCC GGTTACCATG ATCACCTTTG ATTTTGGACA GGCGGAAAAT 
GCGCCCATAG ACGGCATTCG CGTTCTGAAA ACCGTCAAGC CAGGCCAGGG TATCCCGTTT 
GTCCGTTTTT TCCACCCCAA TATTTCATCC CTGTGGAAAG CCATGCAAAA GGCGGATGCC 
GATATCTATT ACCAGCGTAC CGCCGCCTAC CTGACCGGTG TTGTCTGCCT GTTTGCCCGG 
CGGCACAAAA AAAAGTTTGT CTATGCCGGG GCGCATGATT CAGACTTTGT AAAAGGAAGC 
GAACTGCTGG CCCATGCCAG GGACAGGTGG CTTTTTCGAT ATGGCTTACA AAGGGCGGAT 
GCAGTGATTG TACAGAACGG GCAGCAGGAA AAAGACTGCG CCAGAAACTA TTCCGCGGCC 
CCCTTTCTGG TGCCGAATTT CTATCCCATG CCGAAAAAAC AGGCCGAAAA TAAAGGAGCT 
GCCATTTTAT GGGTCGGCAC CATGCGGCCT TTCAAACGCC CGGAACTGTT TCTCGACCTT 
GCCGGCGCCC TGCCGGAGCA CCGTTTCATA ATGATTGGCG GAGCCGATCC GTCCCGACCA 
GACTATTATC GGGCAATCAG GCAACAGGCG GAAAAACACG ACAACCTGGA CTTTCTCGGG 
TTTCAGCCCC TGGATGAAAC GGAAAAAGCG TTTGACCGGG CCGCCCTGTT TGTGAACACA 
TCCTTGCAGG AAGGATTTCC CAACACATTT TTGCAGGCCT GGGCCAGGGG TGTGCCAACG 
GTCTCTTTCT TTTCCCCGTT TACAGGCAGC AATGACAACA GACCCGGCAT TTATGTAAAC 
ACGCCGGAAG AACTGGCCCG CAACGTGGCC CACCTGATGA ATACACCGGG CGAACGACAA 
ACCTCAGGGG AACAGTACCG GCAATACTAC CTGGACCACT TTTCCCCGAA TGCAGTGGTT 
CCTCAATATG AAGCCATCAT CAACCGGCTG GTCTGA

Protein sequence

MATKPHICFV APMAWPVLCE VPGLQAIGGA ELQQVLLARE LAHRGYPVTM ITFDFGQAEN 
APIDGIRVLK TVKPGQGIPF VRFFHPNISS LWKAMQKADA DIYYQRTAAY LTGVVCLFAR 
RHKKKFVYAG AHDSDFVKGS ELLAHARDRW LFRYGLQRAD AVIVQNGQQE KDCARNYSAA 
PFLVPNFYPM PKKQAENKGA AILWVGTMRP FKRPELFLDL AGALPEHRFI MIGGADPSRP 
DYYRAIRQQA EKHDNLDFLG FQPLDETEKA FDRAALFVNT SLQEGFPNTF LQAWARGVPT 
VSFFSPFTGS NDNRPGIYVN TPEELARNVA HLMNTPGERQ TSGEQYRQYY LDHFSPNAVV 
PQYEAIINRL V