Gene Daud_2004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_2004
Symbol
ID	6026520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	2111307
End bp	2112602
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	57%
IMG OID	641594826
Product	hypothetical protein
Protein accession	YP_001718127
Protein GI	169832145
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAACAAC TGCTTCCTCA AATCGGGCTG ATACTCTTAC TTATTTTGCT CAACGCGGTG 
TTTGCCTCCG CGGAAATCGC CCTGGTCTCC GTCCGCCGTT CGCGCATTGA CGTCCTCGCC 
AAAAAGGGGG ACCGCCGCGC CGCTGCCGTG GCTCGACTCC TCAAAGGGGA TCCGGGCCGC 
TACTTGGCGG CTATCCAGAT CGGCGTAACC CTGGCCGGGT TTCTGGCCAG CGCCACCGCC 
GCCGTCACCC TGGCCGTGCC GCTGCAGAAC ATCTTTCAAA ACGTACCCGT AGCCGCAGTC 
AACACTAATG CGCAGGGAAT CGCCGTGGTA ATCACCACCA CGCTGATCGC GTTAATCACC 
CTCATCTACG GCGAGTTGGT CCCTAAACGG GTGGCGTTGC AGGCAACTGA ACGTGTCGCC 
CTCCTTCTGG GCCGACCCAT TCACTTGTTC TCGCGCGCAA CACGCCCGGT AATCCTTCTG 
CTGACCGCAG CCACCAACTA CTCGCTGCGC CTGTTCGGAT TAAAGCCCGG TGTTAACGAA 
GACCAGGTGA CCGAAGACGA ACTCAAACAA ATCATTGTAA ACCAAAGCAC CCTGGACCGG 
GAAGAGCAAC GGCTTCTTTG GGACGTCTTC GACTTCGGAG ACGCGGTGGC TTATGATGTA 
ATGGTCCCGC GCACCGACGT GGTAGGGGTC GAAACCAGCA CTTCTGTGGC GGACACCCTT 
CGTCTGATGT CGGAAACAGG CCATTCCCGC ATTCCGGTCT ATGGGCAGAA CCTTGACGAC 
ATCAAAGGTA TTGCCGGGAT CAAGGACCTG GTCCCTTATC TCTTGCGCGG GGAGGAGCAG 
GCGCCGGTAG AGAAGGTGGT TCGCCCGGCC TACGTTGTCC CGAATACTGT TCCGATCAGG 
CAGTTGCTCC GTGACCTACA GAAGCGCGGG GTGTCAATGG CCGTGATCGT AGATGAATTC 
GGCGGGACTG ACGGTGTTGT CACCGTGGAG ACTCTGCTCG AAGAGCTTGT AGGAGAAATC 
CGCGACGAGT ACGACCGGGA GGACCAAGAA ATCTTATCTT CAGAAGACGG GCAAGCGATC 
GTCAAGGGTT CGGCTGGAGT GGATGAGGTC AACCGCCAAC TAAAACTGGC GATCCCAGAG 
AGCGAGGAAT ACCATACGAT CGCCGGTTTC ATCCTCGATC AGCTCAACAA GGTGCCAAAA 
GCCGGGGACC GTGTGACTTT AGACGGTACC GTACTTGAGG TCGCAAAAAT GAAGGCGAAC 
CGCATCTTGA TGGTTTCGAT CAAAAAAGAA GATTGA

Protein sequence

MEQLLPQIGL ILLLILLNAV FASAEIALVS VRRSRIDVLA KKGDRRAAAV ARLLKGDPGR 
YLAAIQIGVT LAGFLASATA AVTLAVPLQN IFQNVPVAAV NTNAQGIAVV ITTTLIALIT 
LIYGELVPKR VALQATERVA LLLGRPIHLF SRATRPVILL LTAATNYSLR LFGLKPGVNE 
DQVTEDELKQ IIVNQSTLDR EEQRLLWDVF DFGDAVAYDV MVPRTDVVGV ETSTSVADTL 
RLMSETGHSR IPVYGQNLDD IKGIAGIKDL VPYLLRGEEQ APVEKVVRPA YVVPNTVPIR 
QLLRDLQKRG VSMAVIVDEF GGTDGVVTVE TLLEELVGEI RDEYDREDQE ILSSEDGQAI 
VKGSAGVDEV NRQLKLAIPE SEEYHTIAGF ILDQLNKVPK AGDRVTLDGT VLEVAKMKAN 
RILMVSIKKE D