Gene DhcVS_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DhcVS_1044
Symbol	argH
ID	8657975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dehalococcoides sp. VS
Kingdom	Bacteria
Replicon accession	NC_013552
Strand	+
Start bp	970375
End bp	971760
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	50%
IMG OID
Product	argininosuccinate lyase
Protein accession	YP_003330489
Protein GI	270308431
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000156522
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCATA TCCGCAGCCG CTTTTCAAAA CCGGCAGATG AACTGGTGGT CAGATATACC 
ACCTCTTTAC CGTTTGACTG GCGTTTATAC AAGGAAGATA TAAAATGCTC AACCGCCCAT 
GCCCGCATGC TGGGTAAGCA GGGCATTATC TCCGCTGAGG ACAGCCAGTC CATCGTAAAC 
GGGCTTTCTG ATATCCTCAC CGAGATTGAA ACCGGCAGTT TTGTGTTTAA ACCCGAAATG 
GAAGATATTC ACATGGCCAT AGAGGGGCGG CTTTTTGAAC TTATCGGCGA GGCGGCCGGC 
AGATTGCACA CCGCCCGCAG CCGGAATGAC CAGGTAGCTA CCGATGTACA CCTGTTTGTA 
AAAAACACCT GTACCAGTAC TATCAATAAA ATACGCACCC TTCAGGGGGC TTTACTGAAA 
CAGGCGGAAG CCCACCAGCA AACCGCTTTG CCCGGTTATA CCCATCTACA GGTGGCTCAA 
CCGGTGCTTC TTTCGCACCA CCTGCTGGCT TACTTTGAGA TGCTGGAGCG GGACTGCGGG 
CGTTTTACAG ATATGCAAAA ACGCTCAGAT GTGATGCCTC TGGGCAGCGG GGCTTTGGCT 
GGCGTACCTT ATCCGCTTGA CCGCGAGATG GTAGCCAAAG AACTGGGTTT TACGGCTATC 
AGCCAGAACT CGCTGGATGC TGTTTCAGAG CGGGACTTTG TACTGGAATA CCTTTCAGAC 
GCCGCCATCT GCCAGATGCA CCTCTCCAGA CTGAGTGAGG AAATGGTGAT ATGGTCTTCG 
GCTGAATATG CCTTTGTAGA GCTTGATGAT GCCTATACCA CCGGCTCAAG CATTATGCCC 
CAGAAGAAAA ACCCTGATGT GGCTGAGCTT TGCCGCGGCA AGACCGGGCG GGTATACGGC 
TCTCTAAATA CCATGCTGAC TATCATGAAG GGACTGCCGC TGTCATACAA CCGTGACCTT 
CAGGAAGATA AAGAACCTCT GTTTGACTGC GTGGATACCC TGGGTGACAG CCTTGAGGTA 
TTTGCAGGCA TGATAAAAAC CGCCACGTTT AAACCTGAAC GCATGCTCCG TGCTTTGGAA 
AAAGGGTATG TGCTGGCAAC TGATATTGCT GATTATCTGG TGGGTAAAGG TGAAAGTTTC 
CGTAATTCAC ACGGCATTGT AGCCCGTCTG GTGAGCTACG CTATTTCCCA AAATAAAACC 
TTTGGCAAAC TGAGCCTTGA AGAATACCGC CAATTTTCAA ACCTTTTTGA CAAAGATATT 
TATACAGTAG ATATAAAGTC TGCTTTAAAC GCCCGCAACC TGACCGGCGG AACTGCACCA 
AAACAAATAG CCCAGGCAAT TGCCCGGGCT AAGAAAATAC TGGCAGAAGC TGGAGCTAAA 
AACTAA

Protein sequence

MSHIRSRFSK PADELVVRYT TSLPFDWRLY KEDIKCSTAH ARMLGKQGII SAEDSQSIVN 
GLSDILTEIE TGSFVFKPEM EDIHMAIEGR LFELIGEAAG RLHTARSRND QVATDVHLFV 
KNTCTSTINK IRTLQGALLK QAEAHQQTAL PGYTHLQVAQ PVLLSHHLLA YFEMLERDCG 
RFTDMQKRSD VMPLGSGALA GVPYPLDREM VAKELGFTAI SQNSLDAVSE RDFVLEYLSD 
AAICQMHLSR LSEEMVIWSS AEYAFVELDD AYTTGSSIMP QKKNPDVAEL CRGKTGRVYG 
SLNTMLTIMK GLPLSYNRDL QEDKEPLFDC VDTLGDSLEV FAGMIKTATF KPERMLRALE 
KGYVLATDIA DYLVGKGESF RNSHGIVARL VSYAISQNKT FGKLSLEEYR QFSNLFDKDI 
YTVDIKSALN ARNLTGGTAP KQIAQAIARA KKILAEAGAK N