Gene WD1008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	WD1008
Symbol
ID	2737737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Wolbachia endosymbiont of Drosophila melanogaster
Kingdom	Bacteria
Replicon accession	NC_002978
Strand	-
Start bp	966880
End bp	968547
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	35%
IMG OID	637173164
Product	aminopeptidase P
Protein accession	NP_966734
Protein GI	42520819
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAAA TCAAAGAATT TCGTTCTTTT ATGCACGAAA TAAACGTTGA TGCATTTGTG 
TTACATACTA AAGACGAATA TTTAAATGAG TATTCAGAGG AGCTAACAAA GCTGTGTGGC 
TTCACAGGAA CAAATGGGCT GCTTATTGTC ACAAAAAACA ACAAGTGCCA ATTTTTTACA 
GATGGACGCT ATATCACACA AGCTCACAAT CAGCTCGATC AGGGCAATTT TCAAGTATAT 
AATATACAAG AAGAGGATCC ACGCGAATGG ATAAAAGCAA ACTTAACATC GACTGCCTCA 
CTAGGTTATT ATTTGCAATA TTTTACCATG GAAGATATAA GAAAGTATGA GAATATCTGT 
AAATTAATAC CCTGTTTAGC TGGAAAAAAA AGTGACTATC GAAAACAAGC AGTGGTTTTA 
CATTCTATTA AATATGCTGG TGAAAGTAGT AAGGACAAAT GTGAAAAAGT CGCTAAAAGT 
ATAGATAAAG AAGCTGAAGC AGTGCTTTTA ACTGATCCAA ATTCAATTTC ATGGTTATTA 
AATTTAAGAA ACGAAAATGC TAAATATACT CCATGTATAT TGGGTCGTGC TATATTGTAT 
AAAAGCGGTA ATGTTGATTT GTTTATTCAA GATAAAGAAC ATTCAACTAT AGAAGCAAAT 
TTAGGCAATC ATATAAATAT TTTTGATATC AGTGAGCTAG AAAATTCGCT GCACAAGCTA 
AATTCAATAG TTATAGATCC AAACACAACT CCAATGAGTA TCATGGCTGT AATAAAAGAT 
AAACAGGTAG CTGAAAGAGA GGATCCTTGT TTAATTTATA AAGCAGTAAA AAATCAAACT 
GAAATAGCTG GGGCTATAAA TGCGCACATC AGAGATGGAG TGGCAGTTAC AAATTTTCTA 
CATTGGCTTG AAAGTAATGT TGGTACAGAG CTTGAAGCTG AAGAAAGGAT TTTAGAATAC 
AGAAAAGAGC AGAATTTGTT TAAACAATTG AGCTTTCCAA CAATTTCTGC ATTTAATGAG 
AATGGGGCAA TAATTCACTA TCGTGCAAGC AGTAAGACGA ATAAAGTAAT TCAGAAAGAT 
GGACTGTATT TGATTGACTC TGGTGGCCAG TACCTTGACG GCACAACTGA TGTGACAAGA 
ACTGTAGTAG TTGGTAATCC GACCAATGAG CAAATAACCC ACTATACAAT AGTACTCAAA 
GCTCACATTG CTATAGCAAG TGTCGTCTTT CCCCCCGGCA CTACTGGTGG AGAATTGGAT 
ATATTGGCAC GTACGCATTT ATGGAAATTT GGAATGGACT ATATGCATGG TACAGGGCAT 
GGAGTAGGAA GTTACCTATC AGTACACGAA GGACCACAAG CAATATCAAA AAGTAATAAA 
GTGAAACTCA CGCCAGGGAT GATACTTTCC AACGAACCTG GCTATTACAT TCCGGGAGAG 
TATGGAATAA GGATTGAAAA TCTGATGTAT GTCAACAGAC AAGAAAACGG CTTCTTAAAC 
TTTAAACAAC TGACCTCTAT TCCATATGAT AGAAGACTAA TAAATGTGCA AATGCTTACT 
AAGGATGAAA TTGAATGGAT AAATGGCTAC CATCAATTTA TCTATAAAAA CTTAGAAAAT 
AGCGTCAAAG ATAAGGAGTG GTTAAAGAAA GTATGTGACC CTTTATAA

Protein sequence

MSKIKEFRSF MHEINVDAFV LHTKDEYLNE YSEELTKLCG FTGTNGLLIV TKNNKCQFFT 
DGRYITQAHN QLDQGNFQVY NIQEEDPREW IKANLTSTAS LGYYLQYFTM EDIRKYENIC 
KLIPCLAGKK SDYRKQAVVL HSIKYAGESS KDKCEKVAKS IDKEAEAVLL TDPNSISWLL 
NLRNENAKYT PCILGRAILY KSGNVDLFIQ DKEHSTIEAN LGNHINIFDI SELENSLHKL 
NSIVIDPNTT PMSIMAVIKD KQVAEREDPC LIYKAVKNQT EIAGAINAHI RDGVAVTNFL 
HWLESNVGTE LEAEERILEY RKEQNLFKQL SFPTISAFNE NGAIIHYRAS SKTNKVIQKD 
GLYLIDSGGQ YLDGTTDVTR TVVVGNPTNE QITHYTIVLK AHIAIASVVF PPGTTGGELD 
ILARTHLWKF GMDYMHGTGH GVGSYLSVHE GPQAISKSNK VKLTPGMILS NEPGYYIPGE 
YGIRIENLMY VNRQENGFLN FKQLTSIPYD RRLINVQMLT KDEIEWINGY HQFIYKNLEN 
SVKDKEWLKK VCDPL