Gene DET1002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DET1002
Symbol
ID	3229731
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dehalococcoides ethenogenes 195
Kingdom	Bacteria
Replicon accession	NC_002936
Strand	-
Start bp	914564
End bp	915781
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	51%
IMG OID	637120566
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_181722
Protein GI	57234264
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00183695
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCCAGAA AAAAATTACG TATTGCACTT ATCAGCTTGC ACAGCTGTCC TCTGGGGCAG 
CCCGGCGGAC GGGATACCGG CGGTATGAAT GTGTATATCT GCGAACTGGC CCGGACTTTA 
GGCCGTTTAG GGCACCAGGT TGATATTTAT ACCCGCGCCC ATGACCCCCG TGATGACGTC 
TGGGAATTTT TAGCCCCGAA CGTGCGGCTT ATTCATATTC AGGCCGGGCC GGTAGAGGAT 
ATGGGCAAGC TGGCCCAGTA TGAGCATCTG GAGAGCTTTG TCTGCGGGCT GGAAAAATTC 
CGTAAACACG AGGGTATTAC ATATGACCTT ATCCACAGCC ATTACTGGCT GTCTGCCAGA 
GCCGGGCTGG TTTTAAGTAA GCACTGGAAT GTACCCCATC TGGTTATGTT TCACACTCTG 
GGGAAGGTTA AAAACCGTTT GATGCAGGCC CAGGTTGACC CTCAGCTCCG CTTGGATGCC 
GAGCAGAATA TAGTCCAGGA AACCGACCTG ATAATAGCCT CTACCCAAAA TGAAAAAGAA 
GACCTGATAT CTTTGTATCA GGCGTCAGCG GATAAAATAC GGGTAATTCC CTGTGGGGTA 
AATACCAATC TTTTCTCTCT GGCCAACCGC GCCGAATCTG AAGCAGTCCT GGGGCTTTCC 
CAAGTGCCTA AGGCATTATT TGTGGGGCGG CTGGAGAAGC TGAAGGGGCT GGATAATCTG 
CTGAGGGCGG TTGCCCTGAT TGATAGTGAT ATGGAGCTTA TGGTGGTGGG CGGTGACGAA 
TACAGCCAGG GGGAAAGAAA CCGGCTGGAA GCTCTGTCCG GAGAACTTGG CATCTCGGAT 
AAAGTGAAAT TTTACGGGGC GGTCAGGCAG GATATGCTGG CAGGTTATTA TAATGCCGCC 
AGAGTTTGCG TAGTTCCCTC TTATTATGAG AGTTTCGGCA TGGTTATCCT GGAAGCTATG 
GCCTGCGGCA CTCCGGTGAT TAGCGGCAGG GTGGGGGTTG CGCCTGACAT AATTTGCCCA 
GGCGTAAATG GCTGTCTTAC CCCCGGCAAT CAGCCGGAAC AGCTGGCTGG TTGTATGAAG 
GAATGGCTTT ATCAAAAAGA AATTGACCGC AAAGCTATAA GGGAAATAGC CGGTAAATAC 
GCCTGGCAAT CTGTATCGGC TCAGGTAGAG TCTGTGTATT ATGCTATTTT ATCTGCCAAA 
ACAGCAGAGA TTATTTAG

Protein sequence

MARKKLRIAL ISLHSCPLGQ PGGRDTGGMN VYICELARTL GRLGHQVDIY TRAHDPRDDV 
WEFLAPNVRL IHIQAGPVED MGKLAQYEHL ESFVCGLEKF RKHEGITYDL IHSHYWLSAR 
AGLVLSKHWN VPHLVMFHTL GKVKNRLMQA QVDPQLRLDA EQNIVQETDL IIASTQNEKE 
DLISLYQASA DKIRVIPCGV NTNLFSLANR AESEAVLGLS QVPKALFVGR LEKLKGLDNL 
LRAVALIDSD MELMVVGGDE YSQGERNRLE ALSGELGISD KVKFYGAVRQ DMLAGYYNAA 
RVCVVPSYYE SFGMVILEAM ACGTPVISGR VGVAPDIICP GVNGCLTPGN QPEQLAGCMK 
EWLYQKEIDR KAIREIAGKY AWQSVSAQVE SVYYAILSAK TAEII