Gene Daud_2017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_2017
Symbol
ID	6026257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	2121518
End bp	2122531
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	69%
IMG OID	641594839
Product	thiamine-monophosphate kinase
Protein accession	YP_001718140
Protein GI	169832158
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTTGG CGGATGTCGG CGAGTCGGGG CTGGTGGAGC GGCTCCTCGG GCGGCTTGCC 
CGGGGCCCCG GTGTAGTCCG GGGCGCCGGA GACGACGCCG CCGTGCTCGA TCTGGGCGGT 
AAAGAACTAT TGCTGTTCAC CGTGGACACC CTGGTGGAGG AAGTTCATTT TTCCAGGGCC 
TACGGCTCGA TGCGGGATCT GGGCGCCAAG GCCATGGCTG TAAACCTGAG TGACGTCGCT 
GCCATGGGCG GCCGGCCGGT GTATGCGGTC GTGAGCCTGG CGGCCCCGGC GGAAACCGCG 
GTGGCGGACA TCGACGATTT GTATGCGGGA CTCGCCGGTA CAGCGGCCCG GTACGGCGTT 
ACCCTGGTCG GAGGCGACAC CGTACGTCAC CCGCACGGGC TCGTGATTAC AGTGGCCCTT 
TTGGGTCTCG CCGGGCGGGA GCGGGTGCTG TACCGCAAGG GCGCCGTGTC GGGAGACCTG 
TTCTACGTCA CCGGCAGCCT GGGGGCGAGC GCTGCCGGGC TGTTCTTGTT TCAAAACCCG 
CATCCGGCCT GCCCGCCGGA GGTGGAAGAC CGGTTGAAAA AAGCGCACTT GAGCCCGGAA 
CCCCGGGTGG TGGCCGGCGG CTTGCTCGCC GCCAGCGGGG TGGTCAGCGC CGCCGAGGAC 
ATCAGCGACG GCTTAGCCTT GACCGTGGCC CACATCTGTA CGGCCGGCGG CGTGGGTGCG 
CGACTCCTGG CCGACCGGGT GCCGCTCTCC CCGGAGGTGC GGCGGTTGGG AATCCTTACC 
GGCAAAGACC CCCTGGAGTG GGCGCTCTTC GGGGGCGAGG ACTACGAACT CCTGTTCACG 
GTGCGCCCCG GAGCGGCCGC CGGCCTGGAA AGAGAAATGG CGGCGGCGGG CTGGCCGGTG 
ACCTGGATCG GGGAAGTGCT CGGTCCCGGA GAGGGGCTGT GGCTCGAAGA CGCGGCGGGC 
GCTGGGCGCC CCCTGGTTCC CGGGGGTTAC GACGCCTTCG GGACCGAACC GTGA

Protein sequence

MRLADVGESG LVERLLGRLA RGPGVVRGAG DDAAVLDLGG KELLLFTVDT LVEEVHFSRA 
YGSMRDLGAK AMAVNLSDVA AMGGRPVYAV VSLAAPAETA VADIDDLYAG LAGTAARYGV 
TLVGGDTVRH PHGLVITVAL LGLAGRERVL YRKGAVSGDL FYVTGSLGAS AAGLFLFQNP 
HPACPPEVED RLKKAHLSPE PRVVAGGLLA ASGVVSAAED ISDGLALTVA HICTAGGVGA 
RLLADRVPLS PEVRRLGILT GKDPLEWALF GGEDYELLFT VRPGAAAGLE REMAAAGWPV 
TWIGEVLGPG EGLWLEDAAG AGRPLVPGGY DAFGTEP