Gene Daud_2018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_2018
Symbol
ID	6025626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	2122710
End bp	2124008
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	65%
IMG OID	641594840
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_001718141
Protein GI	169832159
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAGA TGCTGGCGGC CTGGCAGGGC ACGGTCACGC CCGAGATGGA ACAGGTGGCC 
CGGGATGAGG GCTACCCTGT GGAGCCGGTT CTTCAGGGGG TGGCGGCGGG CACCATCGTC 
ATTCCGGCGA ACATGCGGCG GAAGAACCTG AAGGCCGTCG GAATCGGGAC CGGACTACGG 
ACCAAGGTGA ACGCCAATAT TGGCACCTCC CCGAAGCAGT CCGCGCTGGA CGATCACCGG 
GTGAAACTCC GGGTGGCCCT GGACGCCGGT GCCGACGCGG TGATGGACCT GAGTACGGGC 
GGCGACCTGG ACCGGTGCCG GCGGGAGATT CTGGCGTCCT GCCCGGTGCC GGTGGGTACG 
GTGCCGATTT ACCAGGCGGC GATCGAGGCC AAAGAGCGGT ACGGGGCCAT CGTCGCCATG 
CGCGAGGATG AATTGTTCGA AGTGGTTGAA CGTCAGGCCA AGGACGGCGT GGACTTTTTC 
ACCATTCATG CCGGGGTGAC CCTGGAGAGT CTGGACCGGC TCCGAAAGCA GGGACGCCTG 
ACGGACATCG TCAGCCGTGG AGGCTCCTTC CTCACCGGCT GGATGCTGCA CAACGACCGG 
GAAAACCCGT TTTACAAGGA GTTTGACCGC CTGCTCGAAA TCTGCCTGGC CTACGACGTG 
GCCTTAAGCC TGGGGGACGG GATGCGGCCG GGCTGTCAGG CCGACGCCAC CGACCGGGCC 
CAGGTCCAGG AACTTTTGAT TCTTGGTGAG CTTGTCGACC GTTGCCGGGA GGCGGGAGTA 
CAGGTTTTCG TCGAGGGGCC GGGGCACGTG CCCCTGGACC AGATCATTAT GAACGTGCAA 
CTGCAGAAGC GGCTTTGCAA GGGGGCGCCC TTTTACGTCC TGGGTCCCCT GGTGACCGAC 
GTGGCTCCCG GGTACGACCA CATCACGGCC GCCATCGGGG GGGCGGTGGC CGCGATGGCC 
GGGGCCGATT TCCTCTGCTA CGTCACCCCT GCTGAACACC TGGGCCTGCC CACCGTGGAG 
GATGTCCGGG AGGGAGTGAT CGCCACGCGG ATCGCCGGTC ACGCTGCCGA CCTGGTGAAG 
AGGGTTCCGG GCGCGCGGGA ATGGGACGAG AGGATGTCCC GGGCCCGCAA GGCCCTGGAC 
TGGGAAAAGC AGATCGAGTT GGCGATCGAT CCCGAAAAGG CGCGTCGCTA CCATACCGAA 
CGGAACCCGG AAAAATTCGC GGGTTGCACC ATGTGCGGGG AATTCTGCGC GATGAAGCTG 
GTGGGAGAGT ACCTGGGTAA GGACTACGAG AACTGCTAG

Protein sequence

MNQMLAAWQG TVTPEMEQVA RDEGYPVEPV LQGVAAGTIV IPANMRRKNL KAVGIGTGLR 
TKVNANIGTS PKQSALDDHR VKLRVALDAG ADAVMDLSTG GDLDRCRREI LASCPVPVGT 
VPIYQAAIEA KERYGAIVAM REDELFEVVE RQAKDGVDFF TIHAGVTLES LDRLRKQGRL 
TDIVSRGGSF LTGWMLHNDR ENPFYKEFDR LLEICLAYDV ALSLGDGMRP GCQADATDRA 
QVQELLILGE LVDRCREAGV QVFVEGPGHV PLDQIIMNVQ LQKRLCKGAP FYVLGPLVTD 
VAPGYDHITA AIGGAVAAMA GADFLCYVTP AEHLGLPTVE DVREGVIATR IAGHAADLVK 
RVPGAREWDE RMSRARKALD WEKQIELAID PEKARRYHTE RNPEKFAGCT MCGEFCAMKL 
VGEYLGKDYE NC