Gene Dhaf_4739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_4739
Symbol
ID	7261768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	-
Start bp	5063460
End bp	5064647
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	47%
IMG OID	643564650
Product	carboxyl-terminal protease
Protein accession	YP_002461170
Protein GI	219670735
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTGC AGGAGAGTCG TTGGAAAGAG TATTTAAAAA ACCTGGGATG GGTTCTTGCC 
ATAGGGAGTT TGATTTTTAC GGTGGTTGTC GGGGGGTTCA TTGTAACCAA CCTGGATCAT 
TTAGGCCGCT TGGCAAGAGT AGTCAAGCTT GTTGAAAGTG ATTATTTGGA GGAAGTGTCT 
GTAGACACCC TGATCGAAGG TGCCACCAAA GGAATTGTGG ATTCCTTGGG CGATCCTTAT 
TCAAGTTATA TGAATGCTCA AGAGAATGAA GAGCTTATGC AACAAATCGA AGGGAAATTC 
GGCGGCGTGG GGATTATTTT AAGTCTGAAA GATCCTCAGA AACTTGTGGT CCTAAGACCC 
ATTAAAAACA CTCCGGCCGC TAAAGCCGGA CTACAGCCTG GAGATGTGAT TATTAAGATC 
GATGATGTGG ACGCCACCAC CATCGATCAG GAAAAAGCCG TCTCCCTGAT GCGCGGGAAC 
CCGGGGACTA ACGTGACTCT GGTGGTCTAT CGGGAAAGCA TTAAGCAGAA TGTGACCGTT 
CCTTTAACCC GGGAAAATAT CGCAGTACCC ACGGTGGAGG GACTGGCTCT GCCAGGGAAT 
TCGGATATAG CTTATATCGG AATTTCCCAG TTCTCCTCCC ATACAGCTCT TGAACTCAAT 
GAAGTGCTGC GCAATATGGA TATCAGCAAA TACAAAGGGA TGATCTTGGA TTTACGCTAT 
AATCATGGCG GGGAATTAGA ATCTGCTGTA GGAGTAGCCA GTTATTTTGT TCAGCCCGGC 
CCCATTGTCT ATATTGTGGA TAAAGGAGGC AATGCTGTAA CCAAGGCTTC GGAAGGCAAT 
TATTTAGGCA TTCCCTTTGT GGTTTTGGTC AATGAGGAAA GCGCTTCCGC AGCTGAAATC 
GTTTCCGGGG CCATCAAAGA TCGGGGAACG GGCACCCTTG TGGGTACCAA GACCTTCGGT 
AAAGGGATTG TGCAGACGAT TTATCAACTG GATAGGGGGA CCAGTGTGAA GCTGACCACC 
GCCAAGTATT TGACCCCTAA TAAGATCGAT ATTCATAAAA AGGGCATCGA GCCTGATGTG 
GAAGTGAAGC TGAAGGATGG AGAGGAAGCA ACTCTTTCTC CTACTACGAA AGCCTTTGAT 
ACTCAGCTCA CGGAAGCTCT TAAGGTGCTT CGCCAACAGA TGAAATAA

Protein sequence

MDLQESRWKE YLKNLGWVLA IGSLIFTVVV GGFIVTNLDH LGRLARVVKL VESDYLEEVS 
VDTLIEGATK GIVDSLGDPY SSYMNAQENE ELMQQIEGKF GGVGIILSLK DPQKLVVLRP 
IKNTPAAKAG LQPGDVIIKI DDVDATTIDQ EKAVSLMRGN PGTNVTLVVY RESIKQNVTV 
PLTRENIAVP TVEGLALPGN SDIAYIGISQ FSSHTALELN EVLRNMDISK YKGMILDLRY 
NHGGELESAV GVASYFVQPG PIVYIVDKGG NAVTKASEGN YLGIPFVVLV NEESASAAEI 
VSGAIKDRGT GTLVGTKTFG KGIVQTIYQL DRGTSVKLTT AKYLTPNKID IHKKGIEPDV 
EVKLKDGEEA TLSPTTKAFD TQLTEALKVL RQQMK