Gene DET1098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DET1098
Symbol
ID	3229606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dehalococcoides ethenogenes 195
Kingdom	Bacteria
Replicon accession	NC_002936
Strand	-
Start bp	998517
End bp	1000886
Gene Length	2370 bp
Protein Length	789 aa
Translation table	11
GC content	55%
IMG OID	637120662
Product	virulence-associated protein E, putative
Protein accession	YP_181813
Protein GI	57234140
COG category	[R] General function prediction only
COG ID	[COG5545] Predicted P-loop ATPase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATACG CCACCGCCAA TAGCCGCAAG GCTATCAAAT GGAAAAACGG CGACACTTCG 
ATGGATGCCT TAAAGGCCAG ATTCCAGAAC ACCGTCCGCA CCACGGAGAC CATTGAGGAA 
TACCGCAAGA TGTCCAAAGC CCAGCAGGCA GACATCAAAG ACATCGGCGG TTTCGTGGGC 
GGGCATCTTC GGAACGGTCG CCGTAAAAAG GGATATGTGC TTTGCCGCTC CATGCTGACT 
CTCGACATGG ACTACGGCGA GCCGGATGTG TGGGATACCA CCATCAGCAA AATCCCGTAC 
CAGTGCCTGT GCCACTCGAC GCATAAGCAT ACACCGGAAA ATCCGAGGCT CCGTCTGGTA 
ATCCCGCTCA CCCGCGAGAT CAGCGAGCCC GAATATGAGC CAGTCGCCAG AATGTTCGCC 
AAGGAAGTCG GCATTGATAT GTTCGACGAC AGCACCTATG AGGCCAACCG CCTCATGTAC 
TGGCCTTCCA CTTCCGTCAA CGGCGAGTAT GTATTCAAGG AAAAGGACGG CGACGCCTTA 
GACCCGGATG CCTACCTTGC CAAATACGAT GACTGGCAGG ACTCCAGCAC ATGGCCGGTA 
TCCTCCCGTG AGTCCTGCGT GGAAGATCAC GGTGCCAGCA AGCAGGCTGA TCCTCTTGCC 
AAGCCGGGAA TCATCGGTGC GTTCTGCCGG GCTTATCCGA TCTCGGAGGT AATCCCGGAG 
TTCCTCTCCG ATGTATATGC TCCGACCGAT GACGAGAACC GCTACGACTA TATCCCTGCG 
GACAGTCCCG CCGGTGCCGT TTCCTACGGA GATAAGTTTT TGTATTCGCA TCACTCCTCA 
GACCCTGCCT GCAAAAAGCT CCTGAATGCT TTTGACCTTG TCCGCGTCCA CCGCTTCAGC 
GATCTGGACA AGGATGTGCT GGATGAGTCA ACCTCGTCGA AGATGCCGTC CTATAAGGCC 
ATGATGGACT TTGCCTCCGG CTGCGACAAG GTGAAAATCC TGCTGCTTTC GGAGAAGCAG 
GCGCAGGCCG GTGAGGAGTT TGCCGCTACA GACGACGGCT CCGATGATGA CTGGAAAGCC 
AAGCTCCAAT ATCAGTCCCG CAGCACCGTC CTTCAGAACA GCGTCTGGAA CGAGATGCTG 
ATCTTGAATA ACGATCCGGA TTGTCAGGGC TTTGCCTATA ACGAGATGGC CAACCGCATA 
CAGGTGATCG GCGATGTTCC TTGGGATCGT CCCGCTGACA ATAAGTTCTG GCGCGATGCC 
GATACGGCGC AGCTGAAAGC CCTGATCGAC ATCCGCTATG TCTGCTTCTC TGACAGAAAC 
CACAATGTCA GCTTTACGAA AGTGGCAGAC GACCGCCGGT TCCATCCCGT GAGGAACTAC 
TTAAACGACC TGCCGAAATG GGATCAGGTG CCTCGCGTGG ACGAGCTCTT TATCCGCTGC 
CTGCAGGCAG ATGACACGAA GTATGTCCGG GCAGTCACCA GAAAAACCTT AGTGGCCGCC 
GTGACCCGCA TCTACCATCC CGGCACCAAG TTCGATACCG TTCCCGTCCT TGACGGCGCA 
CAGGGTATCG GCAAGAGCAC CATGTGGAAG TCTCTTGCCG GTGATGAATA TTTCTCCGAC 
GCCCTTTCGC TTACTGACAT GGACGACAAG TCCGGTGCGG AAAAGCTGCA GGGCTTCTGG 
ATCATTGAAA TCGGCGAACT GGCCGGAATG AAAAAGGCCG ACATCGAGAA GGTCAAGTCC 
TTCCTCTCCA CTTCAGATGA TAAGTACCGT CCCAGCTACG GCAAGGTGGT CGAAAGTCAT 
CCGAGGCAGT GTGTTGTGGT CGCTACGGTC AACGGCGAGC ATGGATACCT CCGTGATATC 
ACCGGAAACC GGCGCTTCTG GATTGTGAAA TGTCGCCAGA CGGAAAATGC CGTGCGCTGG 
AAAATCACGC CCGAAGAACG TGACCAGATA TGGGCGGAGG CCAAGTATTA CTACGAGCAA 
GGCGAAAAGC TGTATCTCGA AGGTGACCTT CTTGCGGAAG CTGAAGAAGC CCAGAGAAGC 
GCTATGGAAA CAGACGAGCG CCAAGGCCTC GTGGAACAGT ACCTGTCAAA GCTCCTGCCG 
GAAAACTGGT CTGAGATGGA TCTCTACCAG CGTCGGAATT TCCTTGACGG TGATGACATC 
ACATCTGATT CCGGCACCGT GGAACGCACC GAGGTCAGCA ATGCGGAAAT CTGGTGTGAA 
TGCTTCGGAA GGAATATCGC TGACTTAAAG CCCACCGACT CTTATGCCAT CGCGGCACTT 
ATGACACAGG TGGACGGCTG GAAGCGTACC AATCGCAGGG CTTCCCAGCC TCTTTACGGA 
CGTCAGCGAT TGTACGAACG CACAACATAG

Protein sequence

MKYATANSRK AIKWKNGDTS MDALKARFQN TVRTTETIEE YRKMSKAQQA DIKDIGGFVG 
GHLRNGRRKK GYVLCRSMLT LDMDYGEPDV WDTTISKIPY QCLCHSTHKH TPENPRLRLV 
IPLTREISEP EYEPVARMFA KEVGIDMFDD STYEANRLMY WPSTSVNGEY VFKEKDGDAL 
DPDAYLAKYD DWQDSSTWPV SSRESCVEDH GASKQADPLA KPGIIGAFCR AYPISEVIPE 
FLSDVYAPTD DENRYDYIPA DSPAGAVSYG DKFLYSHHSS DPACKKLLNA FDLVRVHRFS 
DLDKDVLDES TSSKMPSYKA MMDFASGCDK VKILLLSEKQ AQAGEEFAAT DDGSDDDWKA 
KLQYQSRSTV LQNSVWNEML ILNNDPDCQG FAYNEMANRI QVIGDVPWDR PADNKFWRDA 
DTAQLKALID IRYVCFSDRN HNVSFTKVAD DRRFHPVRNY LNDLPKWDQV PRVDELFIRC 
LQADDTKYVR AVTRKTLVAA VTRIYHPGTK FDTVPVLDGA QGIGKSTMWK SLAGDEYFSD 
ALSLTDMDDK SGAEKLQGFW IIEIGELAGM KKADIEKVKS FLSTSDDKYR PSYGKVVESH 
PRQCVVVATV NGEHGYLRDI TGNRRFWIVK CRQTENAVRW KITPEERDQI WAEAKYYYEQ 
GEKLYLEGDL LAEAEEAQRS AMETDERQGL VEQYLSKLLP ENWSEMDLYQ RRNFLDGDDI 
TSDSGTVERT EVSNAEIWCE CFGRNIADLK PTDSYAIAAL MTQVDGWKRT NRRASQPLYG 
RQRLYERTT