Gene Dhaf_4201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_4201
Symbol
ID	7261221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	-
Start bp	4447639
End bp	4448679
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	51%
IMG OID	643564116
Product	peptidase M28
Protein accession	YP_002460644
Protein GI	219670209
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.920242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACAC GACGGATTTT TTTGAAAATG CTATTTGGTC TGGGAGCCTT CACTTTACCG 
TGGATCGGCT TTGACAACAA GTTAAAAGCG GCGATTGAGC CTTTAATGAA GCAACCCAAG 
GTCAAGCTCT ACGTGGTCCC GCCGGAAGCC CAAACGATTT ATGAGTATTT CCAATCGGCA 
AGCCTCAACA GAACAGCTAT GGATGATATT CTGGCTCTGA GCTCTCCGGA AATGGAAGGG 
AGACGAACCG GTCAGGCGGG AGAGGGAAGA GCTTCCCAGT ATCTGTCCCG GGAGCTGAGC 
ATGCTGGGAC TCAAGCCCAT GGGGGATAAT GATAAGAGTT ATGCCCATGC CTTTACAATT 
CATGAAGTCA AAGAAACTTT TGTAGGTAAC CGCTTAACCT TTACTGTAGG TAACCCTGAC 
CATCTTCGGG CCCCCAGCCT GAATATTCTC GGCGGCCTTA AGGGTGACAC GGAGGAGATT 
ATCCTGGTTT CAGCCCATTA TGATCATCTG GGGATCTTTG AAGGGCAGCT GTACCCGGGG 
GCAAATGACA ACGCTTCCGG AGTAGGCTGT GTCCTTGATG TGATTAGGCG GCTGGTTCGG 
GAGAATACGG TTCCCAAGAA GACTCTGGTC TTTGCCTTTT GGAGTGGGGA AGAGATGGGC 
TTTTTGGGCT CGAAAGCCTT TGTCAGGAAT CCCAGTTTCC CCCTAGACAG AATAAAGGCC 
GTTATCAACG TAGATACCAT CGGTAACGGC ATGATTGGCA ATTTTGGCCT TTGGGCGGAC 
GATAAGGCCG GGATAGCAGT TGAGGCTGTG CAAAAGGCTG CCGCTGAAGT GAGCGCCAGC 
GCTATGGTGG TTTCCGGCAA TGGTCATAAC AGCGACCAGC TTACCTTTGC TAAAGCGGGC 
ATCCCGGCGG TAACCCTTCT GTCCCGGGAA TGGCTGGAAA ATAACCACAC CACTCAGGAT 
ACGATGGGGA TAGTTAAACG GGAGCAGGTT AAGCTGGCTA CGGAAATTGT TTATGGAGCG 
GTCAGGAACC TCGCTTTTTA G

Protein sequence

MQTRRIFLKM LFGLGAFTLP WIGFDNKLKA AIEPLMKQPK VKLYVVPPEA QTIYEYFQSA 
SLNRTAMDDI LALSSPEMEG RRTGQAGEGR ASQYLSRELS MLGLKPMGDN DKSYAHAFTI 
HEVKETFVGN RLTFTVGNPD HLRAPSLNIL GGLKGDTEEI ILVSAHYDHL GIFEGQLYPG 
ANDNASGVGC VLDVIRRLVR ENTVPKKTLV FAFWSGEEMG FLGSKAFVRN PSFPLDRIKA 
VINVDTIGNG MIGNFGLWAD DKAGIAVEAV QKAAAEVSAS AMVVSGNGHN SDQLTFAKAG 
IPAVTLLSRE WLENNHTTQD TMGIVKREQV KLATEIVYGA VRNLAF