Gene Dbac_0042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dbac_0042
Symbol
ID	8375675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfomicrobium baculatum DSM 4028
Kingdom	Bacteria
Replicon accession	NC_013173
Strand	+
Start bp	63104
End bp	64384
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	61%
IMG OID	644999272
Product	amidohydrolase
Protein accession	YP_003156588
Protein GI	256827860
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGTATCT TGATAAAAAA AGTGCGCCTG AATGGAGAGC TGGTCGATGT GCTCATCAAG 
GGCAATCGTT TCGACTCCAT CGGAACGGAC GTGGACTCGT CCGCCGACGT GGTGATCGAC 
GGGTCGGGCA AGGCCATCCT GCCATCCTTC CACAATGCCC ACACCCATGC GGCAATGACG 
CTTCTGCGCG GCTATGCCGA CGATATGGAT CTGCATACAT GGCTGGCCGA TCACATCTGG 
CCCTTCGAGG CCCGGCTGAC GGAGGATGAC ATCTATTGGG GCGCGAAGCT CGCCTGCCTT 
GAGATGATCA AGTCCGGAAC GACCTTTTTC GCCGATATGT ACTGGCATTG GAAGGGCACG 
GCCCGGGCCG TGACGGACAT GGGCATGCGT GCGGCGCTGT CCGCGGCATT TTTTGATTTC 
GACGATCCGG TCCGTGCCGA AACCATGAAG CGGCAGGTCA TGGATCTGCA CGCCGCCAGC 
GTCGCGTTTC CGGACCGGAT TCAGTTCATT CTCGGGCCTC ACGCCATCTA CACCGTGTCT 
TCGGACTCCC TGCGCTGGCT GGGGGAATAC GCGAACCGGC ACGGTCTTCT GGTGCATCTG 
CACCTTTCCG AGACGCAAAA AGAGGTTGAG GACTGTTTGG CCAAACATGG CAAAAGGCCG 
GTGGAGTATC TGCACGAGCT GGGTCTTTTG GCCCCGAACC TGATCCTGGC GCATGCCGTG 
TGGATGACCG GGAAGGAGAT GGAGCTGCTG GCCGGGCACG GGGTGCAGGT CGTGCACTGC 
CCGGTCTCGA ACATGAAGCT GTGTTCCGGG CAGTTCGACT ACGCCGCCAT GCAGGCTCAT 
GGCGTCACCG TGGCCCTGGG TACGGACGGC TGTTCCTCGA ACAACAATCT GGACATGATC 
GAGGAAATGA AGATCGCCTC TCTGCTGGCC AAGGTCACGT CCATGGACCC CACCGTCTTT 
CCGGCCCAGG AAGCTCTCGA CGCGGCCACC GTGAACGGGG CGCGCATGTA CGGCCTGGAT 
GCGGGGTGCA TTGCCTCGGG CAAGCTCGCG GATTGCATTC TGGTCGATCT GGAGCATGTG 
CGCATGGTCC CGAACCATCA CCTTGTGTCC AACCTGGTCT ACAGCGCGAA CAGCTCCTGC 
GTGGACACGA CCATCTGCGA CGGCCGGGTG CTCATGCTCG GCGGCAAGGT CGAAGGCGAG 
GAAGAGATCC TGGCCCAGGT CCGCGCGACA TTGGCCCGTC TGAATGCTCC GCGTGAGCCT 
GAGGGGGACG CATGCTCCTG A

Protein sequence

MSILIKKVRL NGELVDVLIK GNRFDSIGTD VDSSADVVID GSGKAILPSF HNAHTHAAMT 
LLRGYADDMD LHTWLADHIW PFEARLTEDD IYWGAKLACL EMIKSGTTFF ADMYWHWKGT 
ARAVTDMGMR AALSAAFFDF DDPVRAETMK RQVMDLHAAS VAFPDRIQFI LGPHAIYTVS 
SDSLRWLGEY ANRHGLLVHL HLSETQKEVE DCLAKHGKRP VEYLHELGLL APNLILAHAV 
WMTGKEMELL AGHGVQVVHC PVSNMKLCSG QFDYAAMQAH GVTVALGTDG CSSNNNLDMI 
EEMKIASLLA KVTSMDPTVF PAQEALDAAT VNGARMYGLD AGCIASGKLA DCILVDLEHV 
RMVPNHHLVS NLVYSANSSC VDTTICDGRV LMLGGKVEGE EEILAQVRAT LARLNAPREP 
EGDACS