Gene Dole_2226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2226
Symbol
ID	5695073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2698194
End bp	2699621
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	61%
IMG OID	641264831
Product	putative aminopeptidase 1
Protein accession	YP_001530107
Protein GI	158522237
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1362] Aspartyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGGTC AAATGAGCAA AAAAGAGCTG GACGCCTTTT CAAAGAAGAC TATTCGGAAG 
CCCGCCCTGG TGTGGGACGC GCTTTCTCCT GCCGAGACCC GGCAGTCCTT TGATTTTGCT 
GAAAACTACA AGCGGTTTCT GGACGATGCC AAAACCGAGC GAAAGGCTGT GACCGTTATT 
CAGAAGGCCC TGGCCGCCGC CGGCTTTGTG GACATTGACG GCCGGGCCAA AGGCAAGGGG 
AAATTCTACA AGGTGTTTCG CAACAAGGCG GTGGCCGCCG CGGTTGTGGG CAGCGCCCCC 
CTGGACCAGG GCATGCGGAT CATCGCGGCC CACGTGGACT CGCCCCGACT GGACCTCAAG 
CAGAACCCCC TTTACGAAGA GGTGGACCTG GCCATGCTCA AGGTCCACTA CTACGGCGGC 
ATTCGCAAAT ACCAGTGGCT GGCCCGGCCC CTGGCCCTTT ACGGAACAGT GGTGGGCAAA 
GACGGCCGGT CCTTTGATGT GGAGATCGGC GAGGCGGAAA CTGATCCGGT GATCACCATT 
GCCGACCTGC TGCCCCACCT GGCGGCCAAA CTGCAGAACA GCAAAAAATT GTCTGATGTG 
TTTGAGGCCG AAAAACTCAA CCTGGTGGCC GGCAGCCTGC CCGCCGGTGA CGAGAAGCAG 
AAGGACCGGT TCAAGCTTAC CGTGCTCAAA TACCTGTTTG ACCGGTACGG CCTGGTGGAG 
GAGGATTTTG CCAGCGCCGA GCTGGAGGCG GTGCCTGCTG GAAGGGCCAG GGACGTGGGG 
TTTGACCGCG GCCTGATCGG GGCCTACGGC CAGGATGACC GGGTTTGCGC CTACACGGCC 
CTGGCCGCGA TTCAGGACCT GAAGAAGCCG CCCCGGACGG CCGTGGCCCT GTTTTTCGAC 
AAGGAGGAGA TCGGCAGCGA AGGCAACTCC GGCGCCCGGT CCCGGTTCAT GGAGGACTTT 
ATCGCCGACC TGTTTGAAAA ACAGGACGCA CCGGTTTCCG AACGGGTGCT GCGAAAGGCC 
ATCACCGCTT CAGAGGCCCT TTCCGCGGAC GTGAACGCGG CCCTGGACCC GGACTACCAG 
GAGGTCCATG AAAAGCGCAA CGCGGCCCGT CTGGGATACG GTATCTGCAT CACCAAGTTC 
ACCGGTTCCG GTGGCAAGTC CGGGTCCAGT GACGCCAGTG CCGAATACGT GGGCCGGGTA 
CGGCAGATAT TCAACCGGGC CGGCATCGTG TGGCAGACCG GTGAGCTGGG CCGGGTGGAC 
CAGGGCGGCG GCGGCACCCT GGCCAAGTTC CTGGCCGCCT ACGGCATGGA TATCGTGGAT 
TGCGGCCCGG CCCTGCTCTC CATGCACTCA CCCTTTGAAC TCTCCAGCAA GGCCGATGTG 
TACATGACCT TCAAAGCCTT CAAAGCGTTT TTCGATGACC GGCAGTAA

Protein sequence

MTGQMSKKEL DAFSKKTIRK PALVWDALSP AETRQSFDFA ENYKRFLDDA KTERKAVTVI 
QKALAAAGFV DIDGRAKGKG KFYKVFRNKA VAAAVVGSAP LDQGMRIIAA HVDSPRLDLK 
QNPLYEEVDL AMLKVHYYGG IRKYQWLARP LALYGTVVGK DGRSFDVEIG EAETDPVITI 
ADLLPHLAAK LQNSKKLSDV FEAEKLNLVA GSLPAGDEKQ KDRFKLTVLK YLFDRYGLVE 
EDFASAELEA VPAGRARDVG FDRGLIGAYG QDDRVCAYTA LAAIQDLKKP PRTAVALFFD 
KEEIGSEGNS GARSRFMEDF IADLFEKQDA PVSERVLRKA ITASEALSAD VNAALDPDYQ 
EVHEKRNAAR LGYGICITKF TGSGGKSGSS DASAEYVGRV RQIFNRAGIV WQTGELGRVD 
QGGGGTLAKF LAAYGMDIVD CGPALLSMHS PFELSSKADV YMTFKAFKAF FDDRQ