Gene Daud_0918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_0918
Symbol
ID	6027243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	979709
End bp	980746
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	64%
IMG OID	641593730
Product	aminodeoxychorismate lyase
Protein accession	YP_001717063
Protein GI	169831081
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.174013
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACCTTCC GGCAGACAGT CATCGACCGT TCCCTGTACA TTCTTTTGGG GCTCCTGGGA 
TCGGCCGCTT TTCTGATCGG CGCCGCCTGG ATCACCGCCA ACGCGATGCT GGCGCCGGTT 
TGCGACCGGG AAACGGATCC GGTGCTGGTG GAGATCCCGG CCAGGGCAAG CACCGGGCAG 
ATCGGCGCCA TCTTGGCCGA CAAGGGCCTA ATCCGGAACG CCACCGCTTT CCGGTTGTAT 
GCCCGGTTTC GGCGACTGGA TGCCGTCCTG AAAGCGGGAG AGTACGAGCT TTCCCCGTCT 
CTGTCCACCC CGGAGATCAT TGAGATTCTG GCCCAGGGCC GGGCCAGGCT CGTGGCGTTC 
ACCATCCCCG AGGGGCTGAC CTTGAAGCAG ACCGCCGTTT TGCTGGCAGA CCGCGGGTTC 
GTGGACGCCG ATGTCTTTAC GCGGCTCCTG GACGAGAAGG CGGCGTCTCA TCCGCTGTTG 
TCCGGCCTGC CGGAGGAGCA ACGCTCGCTG GAAGGCTACC TTTTCCCGGA CACCTATATG 
ATTTCCATCG GGACCAGCGA AGAACAGATC ATCCGGCTTC TGCTCGCCCG TTTCGAAGAG 
GAAACTGCCC GCCTGGATCT GGAGCGCCGG GCCGCGGCAC ACGGTCTTAA TCTGCACGAA 
GCGGTGACCC TTGCCTCCCT GATCGAGCGT GAGGCACGCG TGGCTGAAGA GCGCCGGGTG 
ATTTCCGGGG TGCTCCACAA CCGGCTCAAG CGGAATATGC TCCTGCAGGT TGACGCCACC 
ATCATCTACG CGCTGGGCGA CTTCGACCGC CAGGTGGTGC TGTACCGCGA CCTGGAGGTT 
GACTCCCCCT ACAACACCTA CCGGTATTCC GGCCTCCCCC CGGGTCCCAT CGCCAGCCCG 
GGCCGGGACT CCCTGATTGC CGCGGTGGAC CCCGACCAAC ACGACTACCT CTACTACGTC 
GCCAAACCCG ACGGCACCCA CGCCTTTTCC CGCACCCTGG CCGAGCACAA CGCCAACAAG 
CGGCGGTACC TGCCCTAG

Protein sequence

MTFRQTVIDR SLYILLGLLG SAAFLIGAAW ITANAMLAPV CDRETDPVLV EIPARASTGQ 
IGAILADKGL IRNATAFRLY ARFRRLDAVL KAGEYELSPS LSTPEIIEIL AQGRARLVAF 
TIPEGLTLKQ TAVLLADRGF VDADVFTRLL DEKAASHPLL SGLPEEQRSL EGYLFPDTYM 
ISIGTSEEQI IRLLLARFEE ETARLDLERR AAAHGLNLHE AVTLASLIER EARVAEERRV 
ISGVLHNRLK RNMLLQVDAT IIYALGDFDR QVVLYRDLEV DSPYNTYRYS GLPPGPIASP 
GRDSLIAAVD PDQHDYLYYV AKPDGTHAFS RTLAEHNANK RRYLP